频率统计的主观性


14

我经常听到有人声称贝叶斯统计数据可能是高度主观的。主要论点是推论取决于先验的选择(即使可以使用无差异或最大熵的原理来选择先验)。相比之下,常客统计通常更客观。这句话有多少道理?

另外,这让我感到奇怪:

  1. 经常性统计的具体要素(如果有)中哪些是特别主观的,在贝叶斯统计中不存在或不太重要?
  2. 贝叶斯主义的主观性是否比常客主义的统计更为普遍

5
当然,频繁主义者的方法比所宣传的更加主观,但是我认为贝叶斯方法仍然更加主观。而且,请不要让自己相信组中先验的不变性或MaxEnt先验的规范在某种程度上是“客观的”-两种类型的先验都可能表达认为具有信息意义的信念,无论如何,无论哪种策略都不能完全适用(例如,我不认为CDF的空间上没有不变的或MaxEnt先验的,并且该空间上的任何先验都将概率1分配给拓扑微薄的集合)。
2014年

2
贝叶斯开始于主观领域,然后数据(希望)将其拉回到客观现实中。经常有人从客观立场开始(或至少认为他们这样做),但随后他们最终以他们的主观假设弄脏了分析。
Aksakal 2014年

2
贝叶斯主义者都知道并且先于他们的假设。常见的人通常不是。
亚历克西斯

Answers:


15

我经常听到有人声称贝叶斯统计数据可能是高度主观的。

我也是。但是请注意,称呼某些主观内容存在很大的歧义。

主观性(两种感觉)

主观可以(至少)表示以下一种

  1. 取决于研究人员的特质
  2. 明确关注个人的知识状态

贝叶斯主义在第二个意义上是主观的,因为它总是提供一种通过以信息为条件来更新由概率分布表示的信念的方法。(请注意,这些信念是某个对象实际拥有的信念,还是仅仅是某个对象可能拥有的信念,与确定它是否是“主观的”无关)。

主要论点是推断取决于先验的选择

实际上,如果先验代表您对某事的个人信念,那么您几乎肯定不会选择它,而不是选择大多数信念。而且,如果它代表某人的信念,那么它或多或少可以是这些信念的准确代表,因此具有讽刺意味的是,关于它如何很好地代表它们,将存在一个相当“客观的”事实。

(即使可以使用无差异或最大熵的原理来选择先验)。

一个可能,尽管这并不能很顺利地推广到连续领域。而且,可以说不可能一次都变得平坦或“无动于衷”所有参数化(尽管我从未完全确定为什么要这么做)。

相比之下,常客统计通常更客观。这句话有多少道理?

那么,我们将如何评估这一主张?

我建议在第二种主观意义上说:这基本上是正确的。从主观上讲,这可能是错误的。

频频主观(第二感觉)

一些历史细节有助于您找出问题所在

对于Neyman和Pearson,只有归纳行为而不是归纳推断,并且所有统计评估工作都具有估计量的长期采样属性。(因此可以进行alpha和功效分析,但不能包含p值)。从两种意义上讲,这都不是主观的。

确实有可能,而且我认为很合理,可以沿着这些思路争论说,频率论实际上根本不是一个推理框架,而是针对所有可能的推理过程的评估标准的集合,这些评估标准强调了它们在重复应用中的行为。简单的例子是一致性,无偏见等。这使得它在意义2上显然是非主观的。但是,当我们必须决定在不适用这些标准时(例如,当没有准则时)该做什么时,它也有可能在意义1上具有主观性。一个无偏估计)或何时适用但矛盾。

费舍尔提出了一种不太主观的频率论,很有趣。对于费舍尔而言,存在归纳推理之类的东西,因为从某种意义上说,一个主题,即科学家,是根据统计学家进行的数据分析做出推理的。(因此,p值而不是alpha和功效分析)。但是,关于如何表现,是否进行研究等的决定,是由科学家根据她对领域理论的理解而做出的,而不是由采用推断范式的统计学家做出的。由于这种渔业分工,主观性(感觉2)和个体主题(感觉1)都位于科学方面,而不是统计方面。

从法律上来讲,费舍尔的频率主义主观的。只是主观的主题不是统计学家。

这些可用的合成方式多种多样,既可以在应用统计资料教科书中找到这两者的几乎连贯的混合物,也可以使用更细微的版本,例如Deborah Mayo提出的“错误统计”。后者在意义2上是相当主观的,而在意义1上则是高度主观的,因为研究人员必须使用科学的判断力-费舍尔风格-找出重要的错误概率并进行测试。

频率论是主观的(第一感觉)

那么,从某种意义上说,频率主义是否主观性较弱?这取决于。实际应用中,任何推理过程都可能充满特殊性。因此,也许问问“频繁性” 是否鼓励主观性(第一感觉)方法更有用?我对此表示怀疑-我认为主观(第二感觉)方法的自觉应用导致主观(第一感觉)结果较少,但是可以用任何一种方法争论。

暂时假设主观(第一感觉)通过“选择”潜入了分析。贝叶斯主义似乎确实涉及更多的“选择”。在最简单的情况下,选择合起来为:一组常见的惯常性假设(似然函数或等价函数)和两组贝叶斯假设(似然性和未知数先验)。

但是,贝叶斯人知道他们对所有这些选择都是主观的(从第二个意义上来说),因此他们倾向于对应该导致较少的主观性(第一个意义上)的含义更加自觉。

相反,如果一个人在一大本测试书中查找一个测试,则可能会感觉结果不太主观(第一感觉),但是可以说这是用其他人对问题的理解代替了自己的结果。尚不清楚这种方式的主观程度有所降低,但可能会感觉到这种方式。我认为大多数人都认为那是无益的。


4
词典中“主观”(直接来自Google)的定义是:基于或受个人感觉,喜好或观点的影响。例如,“他的观点是非常主观的”同义词:个人,个性化,个体,内部,情感,本能,直觉,印象派。请注意,这反映了一种民间理论,即“视图”(即一种信念)是主观的(感觉1:印象派,直觉,怪异等),因为它涉及特定主题的内部状态(感觉2:个性化,个人等)。 。)而不是公开,即非个人化
2014年

2
以认知心理学为例可能会有所帮助。这个领域是完全主观的(从第二个意义上讲,因为这全都是关于人的内部状态及其对这些人的行为的影响),但在第一个意义上却不是主观的,因为心理学家实际上不能仅仅坐在周围并在上面充实东西。自己内部状态的基础。
2014年

2
相反的极端是,要发现某些东西完全是特质和主观的(意义1),而实际上根本不涉及主题。也许卢克雷修斯(Lucretius)解释了《德雷鲁姆·纳图雷de Rerum Naturae)》中的原子和空洞就是一个例子。
2014年

1
究竟。英语对此无济于事……
conjugateprior

1
我已经批准(略调整)拟作出的改动
conjugateprior

6

频繁论者方法的主观性在推理的应用中很普遍。在检验假设时,您设置了置信度,例如95%或99%。这是哪里来的?它不是来自任何地方,而是您自己的喜好或您所在领域的一种普遍做法。

在大型数据集上,贝叶斯先验问题很少,因为当您使用数据更新它时,随着越来越多的数据被处理,后验分布将偏离先验。

前面已经说过,贝叶斯理论是从概率,信念等的主观定义开始的。这使它们不同于常客,后者在客观概率方面进行思考。在小数据集中,这有所作为

更新:希望您像我一样讨厌哲学,但是他们不时有一些有趣的思想,考虑主观主义。我怎么知道我真的在SE上?如果这是我的梦想怎么办?等:)


1
除了置信水平的假设检验的选择(因为同样能够在贝叶斯统计可以说,例如,在选择了一个标准时,HDP / HDI用绳子拒绝或接受假设比较),并主观性发挥作用获得点估计或获得置信区间,也许是在选择估计器时?
Amelio Vazquez-Reina

1
而且,我的理解是,显着性水平是在决策的背景下(即我们是否应该拒绝原假设吗?)而不是在计算概率的情况下在频繁统计中设置的。在贝叶斯决策理论中,关于损失函数的选择可能会争论不休,这会影响最佳(选择)决策。此外,通常从可接受的I型错误率中选择置信度值(例如,从“不高于5%”的误报率直接确定NHST中的95%)
Amelio Vazquez-Reina 2014年

4
npnpn

5
可能值得注意的是,损失函数可能不是主观的(即完全由上下文确定),在这种情况下,贝叶斯最优决策有可能成为完全不同于先前的客观目标。

1
α
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.