如何评估标准偏差?


15

我已经收集了来自85个人对他们执行某些任务的能力的反馈。

回答采用李克特五分制:

5 =很好,4 =良好,3 =平均,2 =差,1 =差,

平均得分是2.8,标准偏差是0.54。

我理解平均值和标准偏差代表什么。

我的问题是:这个标准偏差有多好(或坏)?

换句话说,是否有任何准则可以帮助评估标准偏差。


SD在这里好坏意味着什么?
gung-恢复莫妮卡

7
用这样的数据获得如此小的SD相当困难:对于2.8的平均值,SD必须至少为 。(即使2.8代表四舍五入的值,SD也必须仍然超过0.357。)SD为0.54意味着最多可以回答5(21 2和62 3),最多可以回答6。带有1(带有5 2和74 3)。这表明该问题可能提供的信息很少,因为量表无法有效地区分。0.2×0.8=0.4
ub

@whuber出色的数据判断!但是我也可以想象,他要么对不同的问题求平均值,要么在计算中做错了什么。似乎很难想象人们的反应确实如此统一,特别是在谈论他们应有的能力时。
Erik

Answers:


17

标准差不是“好”或“坏”。它们是数据分布程度的指标。有时,在评分量表中,我们希望范围广泛,因为它表明我们的问题/评分涵盖了我们所评估的组的范围。其他时候,我们想要一个小的sd,因为我们希望每个人都“高”。

例如,如果您在微积分课程中测试学生的数学技能,则可以通过向他们询问诸如类的基本算术问题来获得非常小的标准差。但是,假设您对微积分进行了更为严格的分班考试(也就是说,通过的学生将进入微积分I,那些没有通过的学生将首先进入较低级别的课程)。在相同的测试下,您可能期望麻省理工学院的新生一年的标准差(和更高的平均水平)要低于南Podunk州。3+2

所以。测试的目的是什么?样本中有谁?


2
(+1)只需在“标准差不是'好'或'坏'”的注释上加一点-具有大标准差的预测变量就可以是“好”,因为在回归中,它与标准成反比回归系数估计的误差。另一方面,如果您担心测量的精度,那么大的标准偏差是“不好的”。我猜测原始海报的兴趣更接近于前者,但目前尚不清楚。
2012年

10

简短的回答,很好,比我从调查数据中预期的要低。但是,您的业务故事可能更多是指平均值或前2个百分比的百分比。

对于社会科学研究的离散量表,实际上,标准差是均值的直接函数。尤其是,我通过对许多此类研究的经验分析发现,五点制问卷调查中的实际标准偏差为最大可能变化的40%-60%(此处未记录)。

在最简单的级别上,请考虑极端情况,假设平均值为5.0。标准偏差必须为零,因为求平均值5的唯一方法是每个人都回答5。相反,如果平均值为1.0,则标准误差也必须为0。因此,给定平均值即可精确定义标准偏差。

现在在两者之间有更多的灰色区域。想象人们可以回答5.0或1.0,但两者之间什么也没有。那么标准差就是平均值的精确函数:

stdev = sqrt((5均值)*(平均1))

任何有界标尺上答案的最大标准偏差是标尺宽度的一半。这就是sqrt((5-3)(3-1))= sqrt(2 * 2)= 2。

现在,人们当然可以回答介于两者之间的价值。从我们公司调查数据的元研究中,我发现实践中数字量表的标准偏差为最大值的40%-60%。特别

  • 100%点数比例为40%,
  • 10点刻度的50%
  • 5点秤的60%
  • 二进制刻度为100%

因此,对于您的数据集,我希望标准偏差为60%x 2.0 = 1.2。您得到0.54,如果结果是自我解释的评分,那大约是我预期的一半。技能评分是更复杂的测试结果的平均值吗,因此方差较小?

然而,真正的故事可能是相对于其他任务而言,能力是如此之低或如此之高。报告技能之间的均值或前2个百分比,然后将分析重点放在此上。


-1

如果数据是正态分布的,则可以看到人口的位置。

  • 68%的人处于平均值(2.26 - 3.34)的1个标准偏差内:

在此处输入图片说明

  • 95%的人位于平均值(1.72 - 3.88)的2个标准差内:

在此处输入图片说明

它告诉您数字是如何“分散”的。


1
该答案尚未被接受,因为它是不正确的:在不适用的情况下,它使用近似的经验法则(好像是正确的)。如果用切比雪夫不等式的结论代替(它指出至少75%的观察值位于平均观察值的两个标准差之内;即,至少75%的响应是2或3),答案是正确的。不会提供太多见识。
ub

另外,只有真正正态分布的人口才是这样。从那里,您可以在sd周围均值的情况下,通过评估正常pdf上的积分来精确地任意计算数字。在这里真的没有帮助。
杜巴
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.