作为局外人,对于一个人应该如何进行统计推断,似乎存在两种竞争观点。
工作统计学家认为这两种不同的方法是否有效?
选择一个还被认为是一个哲学问题吗?还是当前的状况被认为是有问题的,并且正在尝试以某种方式统一不同的方法?
作为局外人,对于一个人应该如何进行统计推断,似乎存在两种竞争观点。
工作统计学家认为这两种不同的方法是否有效?
选择一个还被认为是一个哲学问题吗?还是当前的状况被认为是有问题的,并且正在尝试以某种方式统一不同的方法?
Answers:
只要结果的解释是在与分析相同的框架内进行,我认为这并不重要。频繁统计的主要问题是,自然存在一种倾向,即将显着性检验的p值视为零假设为真的贝叶斯a-后验概率(因此1-p是另一种假设是正确的),或将频繁的置信区间视为贝叶斯可信区间(因此,对于我们拥有的特定数据样本,假设真值有95%的概率位于95%的置信区间内)。这种解释是很自然的,因为它将直接回答我们自然要问的问题。
只要答案的形式是可以接受的,并且我们可以就所作的假设达成一致,那么就没有理由比另一个更喜欢-这是课程必不可少的问题。
我仍然是贝叶斯人;
除了Shane所说的,我认为连续体包括:
是的,在所有这些方面,我都知道工作的统计学家和分析师。大多数时候,我住在#3,努力在#2上花费更多的时间。
我认为贝叶斯统计在两种情况下起作用。
一方面,一些研究人员/统计学家绝对相信“贝叶斯精神”,并且在认识到经典的频繁主义者假说框架的局限性之后,决定专注于贝叶斯思想。实验心理学的研究突出了小效应量或临界统计意义,现在越来越依赖贝叶斯框架。在这方面,我想引用布鲁诺·勒科特(Bruno Lecoutre)(1-4)的一些广泛工作,这些人为开发基准风险和贝叶斯(M)ANOVA做出了贡献。我认为,我们可以很容易地根据关注参数上应用的概率(即取决于先验分布)来解释置信区间的事实,这是统计学思维的根本转变。贝叶斯分析国际协会使用贝叶斯模型。弗兰克·哈勒尔还提供有趣的轮廓贝叶斯方法临床医生,适用于随机对照试验。
另一方面,贝叶斯方法已被证明在诊断医学中是成功的(5),并且在传统统计学无法应用的情况下,经常被用作最终替代方法(如果有的话)。我正在考虑一份心理计量学论文(6),作者希望通过非常有限的数据集(12位医生x 15幅射线照相)评估放射线医师之间关于髋部骨折严重程度的共识,并使用项目响应模型处理多发性项目。
最后,最近发表在医学统计杂志上的长达45页的论文对生物统计学中的贝叶斯建模的“渗透性”进行了有趣的概述:
Ashby,D(2006)。贝叶斯医学统计:25年回顾。 医学统计学,25(21),3589-631。
参考文献
我可以想象,在应用领域,由于研究人员/从业者在实用作品中往往是务实的,因此没有给予足够的重视。您选择在给定上下文的情况下可以使用的工具。
但是,那些关心这两种方法背后的哲学问题的人们之间的辩论仍然活跃。例如,请参阅以下安德鲁·盖尔曼(Andrew Gelman)的博客文章:
虽然这是主观的,但我会说:
出于某种原因,它被称为贝叶斯/频率论者“ 辩论 ”。两种方法之间存在明显的哲学差异。
但是,与大多数情况一样,这是一个频谱。有些人非常集中在一个营地或另一个营地,完全拒绝了另一种营地。大多数人可能掉在中间的某个地方。我自己会根据情况使用这两种方法。