贝叶斯统计方法真的比行为统计的传统(频率)统计方法有所改进吗?


19

在参加会议时,贝叶斯统计的倡导者为评估实验结果做出了一些努力。它被吹捧为比真实的统计数据对真实的发现(更少的误报)更加敏感,适当和选择性更大。

我已经对该主题进行了一些探索,到目前为止,我对使用贝叶斯统计数据的好处深信不疑。但是,贝叶斯分析被用来驳斥达里尔·贝姆支持预知的研究,因此,我仍然对贝叶斯分析如何使我自己的研究受益会保持好奇。

因此,我对以下几点感到好奇:

  • 贝叶斯分析与常客分析的力量
  • 每种分析类型对1型错误的敏感性
  • 分析复杂性(贝叶斯似乎更复杂)与收益之间的权衡。传统的统计分析非常简单,并具有完善的得出结论的指导原则。简单性可以看作是一种好处。那值得放弃吗?

感谢您的见解!


1
贝叶斯统计是传统统计-您能举一个具体例子说明传统统计吗?

1
@OphirYoktan:他在谈论频率概率与贝叶斯概率。问题的标题中甚至提到了它。

5
我认为这个问题应该移到这里:stats.stackexchange.com
Mark Lapierre

2
我问了一个关于meta问题,关于它是否应该是主题。

1
我认为这个问题可能有一个“好”或“正确”的答案。例如,如果有人可以说“对于每个类型为1错误和类型2错误频率测试,都有一个贝叶斯测试为类型1错误和类型2错误 ”,这将是一个很好的答案。或类似“每个常客测验都等同于没有先验信息的贝叶斯测验”。也就是说,这不必是常客和贝叶斯主义者之间的宗教战争。我只是在争论,因为我不了解答复与OP中特定问题的关系。αβαβ-X
SheldonCooper

Answers:


14

对项目符号内容的快速响应:

1)贝叶斯分析与频频分析的幂/类型1错误

询问类型1和功效(即,减去类型2错误的概率)意味着您可以将推理问题放入重复的采样框架中。你是否可以?如果您做不到,那么别无选择,只能远离常人推论工具。如果可以,并且估计器对许多此类样本的行为具有相关性,并且如果您对特定事件的概率陈述不特别感兴趣,那么我就没有充分的理由提出建议。

这里的论点不是说这种情况永远不会出现-当然会发生-而是在应用方法的领域中通常不会出现。

2)分析复杂性(贝叶斯似乎更复杂)与收益之间的权衡。

询问复杂性的去向很重要。在常客程序中,实现可能非常简单,例如,最小化平方和,但是原理可能任意复杂,通常围绕选择哪个估计量,如何找到正确的测试,何时思考的问题进行讨论。他们不同意。举个例子。看到在本论坛中进行的,充满活力的讨论,讨论中有一定比例的不同置信区间!

在贝叶斯过程中,即使在看起来像“应该”很简单的模型中,实现也可以是任意复杂的,通常是因为积分很困难,但是原理却非常简单。而是取决于您希望混乱的位置。

3)传统的统计分析非常简单明了,有完善的得出结论的准则。

我个人已经不记得了,但是肯定是我的学生从来没有发现这些简单明了,主要是由于上述原理的扩散。但是,问题实际上不是程序是否简单明了,而是考虑到问题的结构,是否更接近正确。

最后,我强烈不同意在两种范例中都有“完善的得出结论的准则”。我认为这是一个很好的事情。当然,“找到p <.05”是一个明确的准则,但是对于哪种模型,进行了哪些修正等?当我的测试不同意时该怎么办?就像其他地方一样,这里需要科学或工程上的判断。


我不确定询问类型1 /类型2错误是否暗示有关重复采样框架的任何内容。似乎即使我的零假设不能被重复采样,询问类型1错误的可能性仍然有意义。当然,在这种情况下,概率不在于所有可能的假设上,而是在于我单一假设中的所有可能样本上。
SheldonCooper 2011年

在我看来,一般的论据是这样的:尽管可以为“一次射击”推断定义类型1(或2)错误(类型1 vs 2只是我可以犯的错误类型的一部分),除非我造成此错误的原因是反复进行的试验,两种错误类型都不会出现频繁出现的可能性。
共轭

我的意思是,始终会在重复试验中嵌入犯下1类(或2类)错误的问题。每个试验都从原假设中抽取一组观察值。因此,即使很难想象对一个不同的假设进行抽样,但仍然存在重复的试验,因为很容易想象对来自同一假设的一组不同的观察结果进行抽样。
SheldonCooper 2011年

1
我感到困惑:如何确定“什么是随机的”?例如,假设您有一个,有人从“中“随机”取样。还假设还存在“智能观察者”,他们知道the的确切内容。即使“智能观察者”可以确定地准确预测将要抽取的内容,采样仍是“随机”的吗?如果骨灰are不再存在,有没有改变?
概率

1
我对常客的“重复”性质的问题是,为了工作,条件必须保持不变。但是,如果条件不变,则应该能够将数据集合并在一起并获得更好的估计。在合理考虑的情况下,常客恰恰忽略了过去的信息。
概率

5

贝叶斯统计可以从一些逻辑原理中得出。尝试搜索“概率作为扩展逻辑”,您将发现更多有关基础知识的深入分析。但基本上,贝叶斯统计基于三个基本“ desiderata”或规范性原则:

  1. 命题的合理性用单个实数表示
  2. p一种|C0C0C1个p一种|C1个>p一种|C0p|一种C0=p|一种C1个p一种|C0p一种|C1个p一种¯|C1个<p一种¯|C0
  3. 命题的合理性要一致地计算。这意味着:a)如果可以以多种方式推理合理性,则所有答案必须相等;b)在两个问题上,我们要获得相同的信息,我们必须分配相同的合理性;c)我们必须考虑所有可用信息。我们一定不能添加不存在的信息,也不能忽略我们拥有的信息。

这三个目标(连同逻辑规则和集合论)唯一确定了概率论的总和和乘积规则。因此,如果您想根据上述三个愿望进行推理,则必须采用贝叶斯方法。您不必采用“贝叶斯哲学”,但必须采用数值结果。 本书的前三章详细介绍了这些内容,并提供了证明。

最后但并非最不重要的一点是,“贝叶斯机械”是您拥有的最强大的数据处理工具。这主要是因为desiderata 3c使用了您拥有的所有信息(这也解释了为什么贝叶斯比非贝叶斯更复杂)。使用直觉来决定“什么是相关的”可能非常困难。贝叶斯定理(Bayes theorem)为您做到了这一点(并且由于3c的原因,它也没有添加任何假设)。

H0H1个大号1个H0大号2H0

  1. PH0|Ë1个Ë2Ë一世
  2. PH1个|Ë1个Ë2
  3. Ø=PH0|Ë1个Ë2PH1个|Ë1个Ë2
  4. H0Ø>大号2大号1个

H0Ø>>1个H1个Ø<<1个Ø1个

现在,如果计算变得“太难了”,那么您必须近似估计数字或忽略一些信息。

有关实际数字的示例,请参阅我对这个问题的回答


3
我不确定这如何回答问题。当然,常客也不同意此列表中的desideratum 1,因此其余的论点不适用于他们。它还没有回答OP中的任何特定问题,例如“贝叶斯分析是否比常客分析更强大或更不容易出错”。
SheldonCooper 2011年

@sheldoncooper-如果常客不同意desideratum 1,那么他们可以在什么基础上建立95%的置信区间?他们必须要求附加号码。
概率

@sheldoncooper-而且,采样概率必须重新定义,因为它们也只有1个数字。一个常客不能拒绝他们自己的理论就拒绝拒绝desideratum 1
概率

1
pH1个|pË1个Ë2|H0H0

1
“他们不能不拒绝自己的理论就拒绝desideratum 1”-这是什么意思?经常有人没有“合理性”的概念。他们有一个“重复试验发生频率”的概念。该频率满足与您的三个需求相似的条件,因此恰好遵循相似的规则。因此,对于定义了频率概念的任何事物,您都可以使用概率定律而不会出现任何问题。
SheldonCooper

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.