在1977年《科学美国人》的布拉德利·埃夫隆(Bradley Efron)和卡尔·莫里斯(Carl Morris)发表的“统计中的斯坦因悖论”一文中,我对计算詹姆斯-斯坦因收缩因子有疑问。
我收集了棒球选手的数据,数据如下:
Name, avg45, avgSeason
Clemente, 0.400, 0.346
Robinson, 0.378, 0.298
Howard, 0.356, 0.276
Johnstone, 0.333, 0.222
Berry, 0.311, 0.273
Spencer, 0.311, 0.270
Kessinger, 0.289, 0.263
Alvarado, 0.267, 0.210
Santo, 0.244, 0.269
Swoboda, 0.244, 0.230
Unser, 0.222, 0.264
Williams, 0.222, 0.256
Scott, 0.222, 0.303
Petrocelli, 0.222, 0.264
Rodriguez, 0.222, 0.226
Campaneris, 0.200, 0.285
Munson, 0.178, 0.316
Alvis, 0.156, 0.200
avg45
是蝙蝠点后的平均值,在本文中用表示。是本季末的平均值。avgSeason
对于一般的(詹姆斯斯坦估计)由下式给出 Z ^ = ˉ Ÿ + Ç (Ÿ - ˉ Ÿ) 和收缩系数Ç由(美国科学1977年第5页)给出 Ç = 1 - (ķ - 3 )σ 2
其中是未知均值的数量。这里有18位玩家,所以k = 18。我可以计算Σ (Ý - ˉ ÿ)2使用的值。但我不知道如何计算σ 2。作者说,对于给定的数据集,c = 0.212。avg45
我试着用两个和σ 2 ÿ为σ 2,但他们没有给出正确答案C ^ = 0.212
任何人都可以是一种足以让我知道如何计算的这组数据?