我目前正在Coursera.org上参加“ 运营管理入门”课程。在课程的某个时候,教授开始处理手术时间的变化。
他使用的度量是变异系数,即标准偏差和平均值之间的比率:
为什么要使用此度量?除了使用标准偏差外,使用CV还有哪些优缺点?这种测量背后的直觉是什么?
我目前正在Coursera.org上参加“ 运营管理入门”课程。在课程的某个时候,教授开始处理手术时间的变化。
他使用的度量是变异系数,即标准偏差和平均值之间的比率:
为什么要使用此度量?除了使用标准偏差外,使用CV还有哪些优缺点?这种测量背后的直觉是什么?
Answers:
变异系数实际上是数据集(例如时间序列)中变异的归一化或相对度量,因为它是一个比例(因此可以表示为百分比)。直观地,如果平均值是期望值,则变异系数是相对于平均值的测量值的期望变异性。
当比较多个异类数据集或在同一数据集上进行的多个测量值之间的比较时,这非常有用-即使两个数据集之间的差异是直接计算的,也可以直接比较两个数据集之间的差异系数或针对两个测量值计算得出的差异系数以不同的比例,采样率或分辨率进行测量。相反,标准偏差特定于从中获得的测量值/样本,即,它是绝对的而不是相对的变化度量。
根据我的理解,意思是位置参数。标清/均值不应视为变异系数。为什么?一个简单的论点是统计距离不同于欧几里得距离。为了测量统计距离,我们使用sd; 一个变量的粗略距离。假设50是平均值,而2是sd,则4%将是cv。现在的平均值是5,标准差是2 cv = 40%。统计变化项与来源无关。因此,sd本身就是衡量变化的好方法。并记住物理学中的一个规则,即在单个问题中不比较两个单位系统。