埃弗隆和莫里斯(Efron&Morris)在1970年代撰写的有关经验贝叶斯背景下詹姆斯·斯坦因估计量的经典系列论文中明确回答了这个问题。我主要是指:
埃夫隆和莫里斯(Efron and Morris),1973年,斯坦因的估计规则及其竞争者-经验贝叶斯方法
埃夫隆(Efron)和莫里斯(Morris),1975年,斯坦因估计量的数据分析及其推广
埃夫隆和莫里斯(Efron and Morris),1977年,斯坦因统计学的悖论
1977年的论文是非技术性的博览会,必须阅读。他们在那里介绍了棒球击球的例子(在您链接的线程中进行了讨论);在这个例子中,观察变量对于所有变量确实是相等的,并且收缩因子是恒定的。c
但是,他们继续举另一个例子,它正在估计萨尔瓦多许多城市的弓形虫病发病率。在每个城市中,对不同人数的人口进行了调查,因此可以将单个观察值(每个城市中的弓形虫病率)视为具有不同的方差(被调查的人口数越低,方差越大)。直觉当然是,不需要像具有高方差(高不确定性)的数据点那样强烈收缩具有低方差(低不确定性)的数据点。下图显示了他们的分析结果,在此图中确实可以看出这种情况正在发生:
相同的数据和分析也以更为技术性的1975年论文的形式呈现,但更为优雅(尽管没有显示出个体差异),请参阅第3节:
在这里,他们提出了一种简化的经验贝叶斯方法,如下所述。令其中是未知的。在所有相同的情况下,标准的经验贝叶斯处理方法是将估计为,并将的后验均值计算为没什么除了James-Stein估计量。Xi|θi∼N(θi,Di)θi∼N(0,A)
ADi=11/(1+A)(k−2)/∑X2jθiθ^i=(1−11+A)Xi=(1−k−2∑X2j)Xi,
如果现在,则贝叶斯更新规则为,我们可以使用相同的经验贝叶斯技巧来估计,即使在这种情况下没有封闭式(请参见论文)。但是,他们注意到Di≠1θ^i=(1−DiDi+A)Xi
AA^
...当所有都相等时,该规则不会减少到斯坦因,而是使用[1973年论文]中推导的这个估计量的一个小变型,它确实会减少到斯坦因。变体规则为每个城市估计一个不同的值。在这种情况下,规则之间的差异很小,但如果较小,则可能很重要。DjA^ik
1973年论文中的相关章节是第8节,但阅读起来有些困难。有趣的是,他们在上面的评论中对@guy的建议有明确的评论:
在这种情况下,推广James-Stein规则的一种非常简单的方法是定义,这样,对转换后的数据应用[原始James-Stein规则],然后转换回原始坐标。生成的规则通过
估算这是没有吸引力的,因为每个都以相同的比例缩小到原点。x~i=D−1/2ixi,θ~i=D−1/2iθix~i∼N(θ~i,1)θi θ我=(1-ķ-2θ^i=(1−k−2∑[X2j/Dj])Xi.
X我Xi
然后他们继续描述估计的首选过程,我必须承认我还没有完全阅读(有点涉及)。如果您对这些细节感兴趣,建议您去那里看看。A^i