我认为重要的是要记住,不同的方法对不同的事物都有好处,而重要性测试并不是统计领域中的全部。
1和3)EB可能不是有效的假设检验程序,但也并非如此。
有效性可能有很多方面,但是您在谈论严格的实验设计,因此我们可能正在讨论一种假设检验,该假设检验可以帮助您以一定的长期频率做出正确的决定。这是严格二分的“是/否”类型的制度,对必须做出“是/否”决定的人来说最有用。确实,非常聪明的人对此有很多经典著作。假设您所有的假设都成立,这些方法在极限上具有良好的理论有效性。但是,EB当然不是为此目的。如果要使用经典的NHST方法,请坚持使用经典的NHST方法。
2)EB最适用于您估计许多相似,可变数量的问题。
埃夫隆本人打开他的书《大规模推理》,列出了统计历史的三个不同时代,指出我们目前正处于
科学大规模生产的时代,以微阵列为代表的新技术使一个科学家团队就能生产出Quetelet羡慕的大小的数据集。但是现在,大量的数据伴随着大量的问题,也许是统计学家被要求一起回答的成千上万的估计或假设检验。根本不像古典大师的想法。
他继续说:
根据其性质,经验贝叶斯论证在分析重复结构问题时结合了常客和贝叶斯要素。重复的结构正是科学大规模生产所擅长的,例如,通过微阵列同时比较患病和健康受试者数千种基因的表达水平。
也许EB最成功最近的应用limma
,可在Bioconductor的。这是一个R-package,其中包含评估两个研究小组中成千上万个基因之间差异表达(即微阵列)的方法。史密斯(Smyth)显示,与您要计算常规基因方式t统计量相比,他们的EB方法产生的t统计量具有更大的自由度。此处使用EB“等同于将估计的样本方差向汇总的估计值缩小,从而在数组数量较小时得出更稳定的推论”,通常是这种情况。
正如Efron所指出的那样,这与经典NHST的开发完全不同,设置通常比确定性更具探索性。
4)通常,您可以将EB视为一种收缩方法,并且在任何有用的收缩方法中都可以使用EB
limma
X1个,。。。,Xķθ^Ĵ小号一世= (1 − c / S2)X一世,小号2= ∑ķj = 1XĴ,CX一世
X¯,
估计的数量越相似,收缩有用的可能性就越大。您所指的书使用棒球命中率。Morris(1983)指出了其他一些应用:
- 收益分享---人口普查局。估算几个地区的人均普查收入。
- 质量保证---贝尔实验室。估计不同时间段的故障数。
- 保险费率制定。估计一组被保险人或不同地区的每次暴露风险。
- 法学院招生。估算不同学校相对于GPA的LSAT分数的权重。
- 火灾报警器--- NYC。估计不同报警框位置的误报率。
这些都是并行估计问题,据我所知,与其说要确定是/否决定,不如说是对某个数量的正确预测。
一些参考
- Efron,B.(2012年)。大规模推理:用于估计,测试和预测的经验贝叶斯方法(第1卷)。剑桥大学出版社。芝加哥
- 埃夫隆(Efron,B.)和莫里斯(Morris,C.)(1973)。斯坦因的估计规则及其竞争对手-一种经验贝叶斯方法。美国统计协会杂志,68(341),117-130。芝加哥
- James W.和Stein C.(1961年6月)。具有二次损失的估计。在第四届伯克利数学统计和概率研讨会论文集(第1卷,1961年,第361-379页)中。芝加哥
- 莫里斯,加拿大(1983)。参数经验贝叶斯推论:理论与应用。美国统计协会杂志,78(381),47-55。
- 史密斯,GK(2004)。用于评估微阵列实验中差异表达的线性模型和经验贝叶斯方法。遗传学和分子生物学中的统计应用第3卷,第1期,第3条。