什么是基准论证,为什么没有被接受?


33

RA Fisher的最新贡献之一是基准间隔和基准原则性论证。但是,这种方法远没有像常客主义者或贝叶斯原则论证那样受欢迎。基准论据是什么?为什么未被接受?


4
有趣的问题。Sprott(2000)说:“基准概率尚未得到广泛接受。这主要是由于其无限制地使用会产生矛盾这一事实。因此,重要的是要强调上述基准使用概率的假设……” 77.他还提供了有关这些矛盾的参考,例如Barnard(1987)。这篇论文一直被用来争论费舍尔“看到了光”并成为了贝叶斯主义者。

3
我以为我已经读过,费舍尔从未真正完成过他的基准论证,或者至少从未使它变得十分一致。Amp在1964年由Dempster发表的一篇文章中说:“得出结论,基准论证的一般形式很吸引人,但是Fisher施加的许多限制是尴尬或模棱两可的,也许应该予以取代。”
韦恩

@韦恩:Dempster的参考令人大开眼界。谢谢。
JohnRos

2
大约35年前,当我在斯坦福大学(放弃我的年龄)读研究生时,我们开设了一个研讨会课程“关于重读Fisher”。研讨会的标题来自早一年左右出版的一篇论文(可能是吉米·萨维奇)。无论如何,每个参加研讨会的学生都必须阅读Fisher的论文之一并进行报告。我的一个关于著名的贝伦斯-费希尔问题。基准论据在那篇论文中很突出。我对论文和班级的记忆并不深刻,因为那是35年前。
Michael R. Chernick

1
费舍尔于1960年代在澳大利亚去世。这是我成为统计学家的很久以前。我确实认为费舍尔认为基准理论是完整的。我认为其他统计学家对此也有漏洞,他努力捍卫它。但是,如果您读过费舍尔(Fisher),您就会知道他头脑清醒,并始终坚信自己是对的(必须在一定时间内)。我没有看过巴纳德的论文,但我怀疑费舍尔是否放弃了基准推断,也怀疑他成为贝叶斯主义者。
Michael R. Chernick

Answers:


16

令您惊讶的是,您没有考虑我们是我们的权威。这是一个很好的参考:《生物统计学百科全书》,第2卷,第1526页;标题为“费舍尔,罗纳德·艾尔默”的文章。从页面第一列的底部开始,一直到第二列的大部分,作者Joan Fisher Box(RA Fisher的女儿)和AWF Edwards撰写

费舍尔(Fisher)在1930年提出了基准论点[11]。...争议立即产生。费舍尔提出了基准论证作为贝叶斯逆概率论的替代方案,他在无法说明客观先验概率时予以谴责。

他们继续与Jeffreys和Neyman(尤其是信心区间的Neyman)讨论辩论。费舍尔发表文章后,于1930年代提出了假设检验和置信区间的内曼-皮尔森理论。随后是关键句。

由于关键点的非唯一性,在多变量估计的情况下,基准论证后来出现了困难。

在《生物统计学百科全书》的同一卷中,Teddy Seidenfeld撰写的文章第1510-1515页名为“基准概率”,其中详细介绍了该方法,并将基准间隔与置信区间进行了比较。引用该文章的最后一段,

在1963年的基准概率会议上,萨维奇写道:“基准概率的目标……似乎是我所说的制造贝叶斯煎蛋而不破坏贝叶斯蛋的意思。” 从这个意义上讲,基准概率是不可能的。与许多杰出的智力贡献一样,具有持久价值的是我们试图理解费舍尔对基准概率的见识所学到的东西。(有关该主题的更多信息,请参见Edwards [4]。)例如,他对贝伦斯-费舍尔问题的解决方案是使用贝叶斯定理对扰动参数进行了出色的处理。从这个意义上说,“ ...基准论点是'向费舍尔学习'[36,p.926]。如此解释,它无疑是对统计知识的宝贵补充。

我认为在爱德华兹的这最后几句话中,尽管费希尔的理论被抹黑了,但他还是试图给费舍尔一个有利的看法。我相信,通过阅读这些百科全书以及其他统计论文中的类似文章以及有关费舍尔的传记文章和书籍,您可以找到关于此的大量信息。

其他一些参考

Box,J.Fisher(1978)。“ TA Fisher:科学家的生活。” 威利,纽约费舍尔,RA(1930)逆概率。剑桥哲学会论文集。26,528-535。

Bennett,JH编辑(1990)统计推断与分析:RA Fisher的精选通讯。克拉伦登出版社,牛津。

爱德华兹,AWF(1995)。基准推论和自然选择的基本定理。生物识别51,799-809。

Savage LJ(1963)讨论。国际统计研究所公报40,925-927。

Seidenfeld,T.(1979)。“统计推断的哲学问题”,里德尔,多德雷赫特。Seidenfeld,T.(1992)。RA Fisher的基准论证和贝叶斯定理。统计科学7,358-368。

Tukey,JW(1957)。一些与基准相关的例子。数学统计年鉴28,第687-695页。

Zabell,SL(1992)。RA Fisher和基准论证。统计科学7,369-387。

正如塞登菲尔德在《生物统计学百科全书》中的文章所述,费舍尔一直在改变它,这一概念很难理解。

自1930年出版以来,费舍尔在他余生的32年中,通过两本书和多篇文章坚定地坚持了(1)中所捕获的思想,并在此基础上进行了推理,我们可以将其称为“基准反推论”。毫无疑问,费舍尔以他的新想法引起了这样的困惑

Seidenfeld引用的等式(1)是参数的基准分布,给定为,其中表示随机变量的一参数累积分布函数在与参数。至少这是费舍尔的最初定义。后来,它扩展到了多个参数,这就是问题的始于贝伦斯-费舍尔问题中令人讨厌的参数。因此,给定观测数据基准分布就像参数的后验分布θX菲德θ|XF/θFXθXXθσθX。但是它的构建没有包含的先验分布。θ

我在获得所有这些方面都遇到了麻烦,但并不难找到。我们真的不需要回答这样的问题。关键字为“基准推论”的Google搜索可能会显示我发现的所有内容以及更多内容。

我在Google上进行了搜索,发现UNC教授扬·汉尼格(Jan Hannig)对基准推理进行了一般化尝试,以改进基准推理。Google搜索产生了他最近的一些论文和PowerPoint演示文稿。我将复制并粘贴以下他的演示文稿中的最后两张幻灯片:

结束语

广义的基准分布通常会导致渐近正确的频临覆盖范围的有吸引力的解。

许多仿真研究表明,广义基准解具有很好的小样本属性。

广义推理在某些应用领域中的当前流行表明,如果计算机在70年前可用,则基准推理可能不会被拒绝。

行情

Zabell(1992)“基准推论是RA Fisher的一个重大失败。” Efron(1998)“也许Fisher的最大失误将在21世纪大受欢迎!”

为了添加更多参考,以下是我从Hannig的2009 Statistics Sinica论文中获得的参考列表。请原谅重复,但我认为这会有所帮助。

伯奇(BD)和艾耶(HK)(1997)。混合线性模型中方差比(或可遗传性)的确切置信区间。生物识别法53,1318-1333。

Burdick,RK,Borror,CM和Montgomery,DC(2005a)。量具R&R研究的设计和分析。ASA-SIAM统计和应用概率系列。宾夕法尼亚州费城:工业和应用数学协会。

Burdick,RK,Park,Y.-J.,DC蒙哥马利和CM,Borror(2005b)。量表R&R研究中误分类率的置信区间。J.质量技术。37,294-303。

蔡TT(2005)。离散分布中的单侧置信区间。J.统计学家。计划 推论131,63-88。

Casella,G.和Berger,RL(2002)。统计推断。Wadsworth和Brooks / Cole的高级书籍和软件,加州太平洋丛林镇,第二版。

Daniels,L.,Burdick,RK和Quiroz,J.(2005)。带有固定算子的量具R&R研究中的置信区间。J.质量技术。37,179-185。

戴维德,美联社和斯通,米(1982年)。基准推理的功能模型基础。安 统计员。10,1054-1074。GA Barnard和DAS Fraser的讨论,以及作者的答复。

戴维德,美联社,斯通,M。和齐德克,合资(1973年)。贝叶斯边际化悖论与结构推断。罗伊 统计员。Soc。老师 B 35,189-233。在DJ Bartholomew,AD McLaren,DV Lindley,Bradley Efron,J.Dickey,GN Wilkinson,APDempster,DV Hinkley,MR Novick,Seymour Geisser,DAS Fraser和A.Zellner的讨论中,以及AP Dawid,M.Stone的答复中和JV Zidek。

登普斯特,美联社(1966)。基于样本数据进行后验分布推理的新方法。安 数学。统计员。37,355-374。

登普斯特,美联社(1968)。贝叶斯推断的一般化。(有讨论)。罗伊 统计员。Soc。B 30,205-247。

登普斯特,美联社(2008)。统计学家的Dempster-Shafer演算。国际近似推理杂志48,365-377。

E. L.,Hannig,J.和Iyer,HK(2008)。非平衡两分量正态混合线性模型中方差分量的基准间隔。J.阿米尔。统计员。副会长 103、854-865。

埃弗隆·B(1998)。21世纪的RA Fisher。统计员。科学 13、95-122。加上评论和作者的反对。

费舍尔(1930)。逆概率。剑桥哲学会论文集xxvi,528-535。

费舍尔,RA(1933)。逆概率和基准概率的概念指的是未知参数。伦敦皇家学会会议录A 139,343-348。

费舍尔,RA(1935a)。统计推断中的基准论证。安 Eugenics VI,91-98。

费舍尔(RA)(1935b)。归纳推理的逻辑。罗伊 统计员。Soc。B 98,29-82。

DAS弗雷泽(1961)。关于基准推论。安 数学。统计员。32,661-676。

DAS弗雷泽(1966)。结构概率和概括。Biometrika 53,1–9。

DAS弗雷泽(1968)。推理的结构。John Wiley&Sons,纽约-伦敦-悉尼。

DAS弗雷泽(2006)。基准推断。在《新帕尔格雷夫经济学词典》(S. Durlauf和L. Blume编辑)中。Palgrave Macmillan,第二版。第543章543

Ghosh,JK(1994)。高阶渐近线。NSF-CBMS区域会议系列。海沃德:数学统计研究所。

Ghosh,JK和Ramamoorthi,RV(2003年)。贝叶斯非参数。统计中的Springer系列。纽约,Springer-Verlag。

Glagovskiy,YS(2006)。柯西和正态分布混合的基准置信区间的构建。科罗拉多州立大学统计系硕士论文。

格林迪(1956年)。基准分布和先验分布:前者不能与后者关联的示例。罗伊 统计员。Soc。老师 B 18,217-221。

口香糖(1995)。测量不确定度表示指南。国际标准化组织(ISO),瑞士日内瓦。

Hamada,M.和Weerahandi,S.(2000年)。通过广义推论对测量系统进行评估。J.质量技术。32,241-253。

Hannig,J。(1996)。以条件分布为极限。经理 论文,(捷克),查尔斯大学,捷克布拉格。

Hannig,J.,E. L.,Abdel-Karim,A.和Iyer,HK(2006a)对数正态分布均值比率的同时基准广义置信区间。南方 J.统计学家。35,261-269。

Hannig,J.,Iyer,HK和Patterson,P.(2006b)基准广义置信区间。J.阿米尔。统计员。副会长 101,254-269。

Hannig,J.和Lee,TCM(2007)。小波回归的广义基准推断。科技 代表,科罗拉多州立大学。

Iyer,HK和Patterson,P.(2002)。构造广义枢轴量和广义置信区间的方法。科技 Rep。2002/10,科罗拉多州立大学统计系。

Iyer,HK,Wang,CMJ和Mathew,T.(2004)。实验室间试验中真实值的模型和置信区间。J.阿米尔。统计员。副会长 99,1060-1071。

杰弗里斯(1940)。注意贝伦斯-费舍尔公式。安 优生学10,48-51。

杰弗里斯(1961)。概率论。克拉伦登出版社,牛津大学,第三版。

Le Cam,L.和Yang,GL(2000)。统计中的渐近性。统计中的Springer系列。纽约:施普林格出版社,第二版。

廖国强和香港艾尔(2004)。具有几个方差分量的正态分布的公差区间。统计员。地震学报14,217-229。

林德利(1958)。基准分布和贝叶斯定理。罗伊 统计员。Soc。老师 B 20,第102-107页。

McNally,RJ,Iyer,HK和Mathew,T.(2003年)。基于广义p值的个体和群体生物等效性检验。医学统计学22,31-53。

Mood,AM,Graybill,FA和Boes,DC(1974)。统计理论导论。麦格劳-希尔,第三版。

Pounds,S。和Morris,SW(2003)。通过近似和划分p值的经验分布,估计微阵列研究中假阳性和假阴性的发生。生物信息学19,123601242。

Salome,D。(1998)。通过基准方法进行星际推断。博士 格罗宁根大学的论文。544汉纳尼

塞尔(Searle,SR),卡塞拉(Casella)和CE麦卡洛克(McCulloch)(1992)。方差组件。纽约约翰·威利父子公司。

史蒂文斯(WL)(1950)。不连续分布的参数的基准极限。Biometrika 37,117-129。

徐翠秋 和Weerahandi,S。(1989)。在存在扰动参数的情况下,对假设的显着性检验中的广义p值。J.阿米尔。统计员。副会长 84,602-607。

Wang,CM and Iyer,HK(2005)。使用广义推断在测量中不确定性的传播。Metrologia 42,145-153。

Wang CM和Iyer,HK(2006a)。在存在A型和B型不确定性的情况下,被测对象的广义置信区间。测量39,856–863。Wang,CM和Iyer,HK(2006b)。使用基准推理对矢量被测量物进行不确定性分析。Metrologia 43,486-494。

Weerahandi,S。(1993)。广义置信区间。J.阿米尔。统计员。副会长 88,899-905。

Weerahandi,S.(2004年)。重复测量中的广义推论。威利(美国新泽西州霍博肯)。

威尔金森(GN)(1977)。关于解决统计推断的争议。罗伊 统计员。Soc。老师 B 39,119-171。与讨论。

是的,我 and Johnson,RA(2001)。U统计量的一个统一的大数强定律,可应用于变换为近对称。统计员。Probab。来吧 51,63-69。

Zabell,SL(1992)。RA Fisher和基准论证。统计员。科学 7,369-387。美国北卡罗来纳大学教堂山分校,北卡罗来纳大学统计与运筹学系,美国NC 27599-3260电子邮件:hannig@unc.edu(2006年11月接收; 2007年12月接收)

我从这篇文章中得到的文章是《统计》杂志19(2009),第491-544页关于广义的推断推断* Jan Hannig北卡罗来纳大学教堂山分校


3
您必须等到到期日……
jbowman 2012年

2
@MichaelChernick:我希望能解释该论点及其缺陷。我认为当前的答案虽然非常有用,但并不完整。
JohnRos

3
@JohnRos:我添加了我的回答,我认为这使我很完整。总的来说,我觉得给某人一个特定的参考,提供完整的答案就足够了。我认为问题的提出者对答案真的很感兴趣,应该去看看参考文献并以这种方式学习。我们都大人了,我们不必用勺子喂所有东西。
Michael R. Chernick

1
向下滚动,你会看到@hbaghishani了它

4
@MichaelChernick,我认为抱怨被低估/不被高估/不赢得赏金并不会带来很多好处。如果有的话,这可能会使用户将来不太可能关注/投票表决您的帖子。对我来说很明显,您在答案中付出了更多的努力(尽管它可以从改进的组织中受益),但是最终,选票只是一个见解-真正的答案可能是“我更喜欢hbaghishani的答案”,为什么他应该说/解释一下吗?另外,您可能会在上面的JohnRos评论中找到答案。
Macro

7

θ中号X大号θ|X中号Xθ大号θ|Xθ中号X=-大号θ|Xdθ-1个


5

只是说了些什么,费舍尔和内曼之间就重要性测试和区间估计存在争议。内曼定义了置信区间,而费舍尔引入了基准区间。他们对构造的争论不同,但构造间隔通常是相同的。因此,直到发现在处理Behrens-Fisher问题时它们有所不同之前,这些定义的差异在很大程度上被忽略了。费舍尔坚决主张采用基准方法,但尽管他的才华和对方法的强烈拥护,但似乎存在缺陷,而且由于统计界认为它是信誉不佳的,因此不经常讨论或使用。贝叶斯和惯常论推论方法是剩下的两种。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.