直觉和变异系数的用途


11

我目前正在Coursera.org上参加“ 运营管理入门”课程。在课程的某个时候,教授开始处理手术时间的变化。

他使用的度量是变异系数,即标准偏差和平均值之间的比率:

Cv=σμ

为什么要使用此度量?除了使用标准偏差外,使用CV还有哪些优缺点?这种测量背后的直觉是什么?

Answers:


8

我认为它是数据散布或可变性的相对度量。如果您想到“标准偏差为2.4”这一说法,那么它实际上不告诉您任何信息而无需考虑平均值(因此,我想应该是度量单位)。如果平均值等于104,则与采用标准偏差2.4的平均值为25,452时相比,标准偏差2.4传达的扩展图完全不同。

归一化数据(减去均值并除以标准偏差)的原因也是相同的,原因是将以不同单位表示的数据置于可比较或相等的基础上(因此也对这种可变性进行了归一化)以帮助进行比较。


2

变异系数实际上是数据集(例如时间序列)中变异的归一化或相对度量,因为它是一个比例(因此可以表示为百分比)。直观地,如果平均值是期望值,则变异系数是相对于平均值的测量值的期望变异性。

当比较多个异类数据集或在同一数据集上进行的多个测量值之间的比较时,这非常有用-即使两个数据集之间的差异是直接计算的,也可以直接比较两个数据集之间的差异系数或针对两个测量值计算得出的差异系数以不同的比例,采样率或分辨率进行测量。相反,标准偏差特定于从中获得的测量值/样本,即,它是绝对的而不是相对的变化度量。


您能否更详细地说明这一部分:“变异系数是某个时间间隔内测量的预期变异性”?
B_Miner 2012年

@B_Miner我是指信号处理意义上的间隔,并在上面进行了编辑。实际上,std dev是平均值或预期的变化。
BGreene 2012年

-2

根据我的理解,意思是位置参数。标清/均值不应视为变异系数。为什么?一个简单的论点是统计距离不同于欧几里得距离。为了测量统计距离,我们使用sd; 一个变量的粗略距离。假设50是平均值,而2是sd,则4%将是cv。现在的平均值是5,标准差是2 cv = 40%。统计变化项与来源无关。因此,sd本身就是衡量变化的好方法。并记住物理学中的一个规则,即在单个问题中不比较两个单位系统。


2
在这里很难看到任何连贯的论点。我们不应该认为sd / mean是变异系数吗?这就是它的定义方式。如果您认为它没有用,请解释原因。(如果您误称它,那就是另一回事了。)统计距离与欧几里得距离不同吗?那只是一个断言,取决于了解统计距离的含义。由于统计中出现了多种距离,因此断言仍然晦涩。(我没有拒绝投票,但我恳请您重写此内容。您可能需要与一个能更好地书写英语的朋友一起工作。)
Nick Cox
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.