为什么总是使用均值0和标准差1分布?


15

我的统计数据是自学的,但是我阅读的许多资料都指向平均值为0,标准差为1的数据集。

如果是这样,那么:

  1. 为什么平均值0和SD 1是一个不错的属性?

  2. 为什么从该样本中得出的随机变量等于0.5?抽取0.001的机会与0.5相同,因此这应该是平坦分布...

  3. 当人们谈论Z分数​​时,这实际上是什么意思?

Answers:


11
  1. 在开始时,最有用的答案可能是0的平均值和1的sd在数学上很方便。如果您可以计算出平均值为0且标准差为1的分布的概率,则可以使用非常简单的方程式计算出分数的任何相似分布。

  2. 我没有关注这个问题。0的平均值和1的标准偏差通常适用于标准正态分布,通常称为钟形曲线。最可能的值是平均值,随着距离的增加,它会下降。如果您的分布是真正平坦的,那么没有其他价值比任何其他可能性更大。您的问题在这里形成得不好。您是否正在查看有关硬币翻转的问题?查找二项式分布和中心极限定理。

  3. “意思是这里”?哪里?z分数的简单答案是,它们是按您的分数缩放的,就好像您的平均值是0,标准差是1。另一种思考方式是,它需要一个单独的分数,因为该分数与意思。该方程式正在计算(得分-平均值)/标准偏差。您这样做的原因千差万别,但其中之一是在统计入门课程中,您拥有不同z分数的概率表(请参见答案1)。

如果您首先查找z分数,即使在Wikipedia中,您也会得到很好的答案。


关于2)我相信,当X是连续随机变量时,p(X = .01)意味着什么。从直觉上讲,该概率在任何地方似乎都是零,因为没有机会X精确地是0.01。发问者应审查连续情况下密度函数的定义,该定义为累积密度函数的导数。
特里斯坦,2010年

7

首先,我们在这里谈论的是标准正态分布,即均值为0且标准偏差为1的正态分布。以标准正态分布分布的变量的简写为Z。

这是我对您问题的回答。

(1)我认为标准正态分布具有吸引力的主要原因有两个。首先,在将每个观察值除以标准差之前,可以通过从每个观察值中减去其均值,将任何正态分布变量转换或转化为标准正态变量。这称为Z转换或Z分数的创建。这非常方便,尤其是在计算机问世之前。

X一世-X¯σX=ž75-65.610.2=0.9215

经常使用标准正态分布的第二个原因是由于解释是根据Z分数提供的。Z转换变量中的每个“观察值”是原始未转换观察值与平均值之间有多少标准偏差。对于原始或绝对性能不如相对性能重要的标准化测试,这尤其方便。

(2)我在这里没有关注您。我认为您可能对累积分布函数的含义感到困惑。请注意,标准正态分布的期望值为0,并且该值对应于关联的累积分布函数上的.5值。

X一世-X¯σX=ž75-65.610.2=0.9215

1

由于您收到了格雷厄姆和约翰的出色解释,所以我将回答您的最后一个问题:

当人们谈论Z分数​​时,这实际上是什么意思?

μσ

因此:(65-80)/ 5 = -3

您可以说65年级的z分数是-3;或换句话说,向左3个标准偏差。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.