谁是常客?


55

我们已经有一个线程询问谁是贝叶斯主义者,以及一个询问问者是否是贝叶斯主义者,但是没有线程直接询问谁是贝叶斯主义@whuber提出了这个问题,以作为对此线程注释,并希望得到解答。它们是否存在(是否有任何自我识别的常客)?也许它们只是由贝叶斯主义者组成的,他们在批评主流统计数据时需要替罪羊怪罪?

对已经给出的答案进行元注释:相比之下,贝叶斯统计不仅是根据使用贝叶斯定理(非贝叶斯定理也使用)来定义的,也不是关于对概率的主观解释的(您不会称其为外行)这样说: “我敢打赌,机会小于50:50!”(贝叶斯)-那么我们是否只能根据对概率的解释来定义频繁性?此外,统计学应用概率,那么对频繁性的定义应仅专注于概率的解释吗?


10
我仍然想知道什么 “常客”?我已经看到这个术语显然是指“任何非贝叶斯的”以及赞同频率论概率论的人。我知道前者很多,但我不确定后者还有什么活的指数!
ub

9
请让我成为常客。让我们团结起来!团结起来,我们将坚强地一次彻底摧毁贝叶斯!
阿克萨卡尔邦

10
@Aksakal重复无数次,我认为它很重要;)
蒂姆

5
细心的人称为贝叶斯。根据DV Lindley的说法:“没有比经验贝叶斯少的贝叶斯了”。所谓贝叶斯方法的许多用户并不是真正的贝叶斯方法。现在有了快速的计算机和MCMC,每个人突然都是贝叶斯主义者?对许多人来说,这只是另一种计算方法,而不是根深蒂固的哲学。人口不连贯地划分,并且仅在常客和贝叶斯之间分配。没有相关教育的人怎么样?贝叶斯性能达到一定程度(或频率)吗?在一周的不同日期或分析类型上可能有所不同?
马克·L·斯通

10
蒂姆,恐怕该线程可能会受到与某些相关线程相同的困惑的影响:即,存在频度对贝叶斯统计方法,并且频度对贝叶斯概率有解释。这是两个不同的问题!您要问哪一个?现在,在@fcop答案的评论中,这种混乱已经很明显了。fcop讨论了概率的定义/解释,而您提到了OLS,这是关于统计方法的。
变形虫说恢复莫妮卡

Answers:


35

现有的一些答案是关于统计推断的,有些是关于概率的解释的,没有一个能清楚地区分。该答案的主要目的是进行这种区分。


“ frequentism”(和“ frequentist”)一词可以指两种不同的事物:

  1. 一个问题是关于“概率”的定义或解释是什么。有多种解释,“频率论解释”就是其中之一。经常有人会坚持这种解释。

  2. 另一个是基于观测数据的关于模型参数的统计推断。统计推断有贝叶斯方法和常客方法,常客将是更喜欢使用常客方法的人们。

现在有一个猜测:我认为几乎没有第一类的常客(P-frequentists),但是第二类的常客(S-frequentists)


概率论的惯常解释

的问题是什么的概率是有100多年历史的激烈进行的辩论的主题。它属于哲学。我指的是不熟悉这场辩论的任何人,请参阅《斯坦福哲学百科全书》中的“概率解释”文章,其中包含有关惯常论者解释的部分。我碰巧知道的另一篇可读性很强的论文是:Appleby,2004年,概率是单例或全无。这是在量子力学基础上编写的,但其中包含有关概率是几节的内容。

Appleby写道:

频率论是这样一种立场,即概率陈述等同于关于某些适当选择的合奏的频率陈述。例如,根据冯·米塞斯[von Mises [21,22]的说法,“该硬币升起的概率为0.5”等同于“以无穷的抛掷顺序,该硬币将以有限的相对频率0.5升起”的陈述。 。

这似乎是合理的,但是这种定义存在很多哲学问题,几乎不知道从哪里开始。明天下雨的概率是多少?毫无意义的问题,因为我们将如何进行无限次的试验。我口袋里的硬币冒出来的概率是多少?您说,在无数次抛掷中头部的相对频率是多少?但是在无限序列完成之前,硬币将磨损,太阳将成为超新星。因此,我们应该讨论一个假设的无限序列。这使人们对参考类等的讨论成为现实。在哲学上,人们很难轻易摆脱。顺便说一句,为什么根本要存在这个限制?

P(Heads)=1/4Frequency(Heads)1/2P(Heads)

我想简短地回答一下,所以我在这里停下来。请参阅上面的参考。我认为要成为顽固的P频率主义者真的很困难。

(更新:在下面的评论中,@ mpiktas坚持认为这是因为常客定义在数学上是没有意义的。我在上面表达的观点是常客定义在哲学上是有问题的。)


频率统计法

P(Xθ)θXXθ

θθ^θθ

当今自然科学中使用的大多数统计数据都是基于这种方法,因此今天周围肯定有很多S频繁主义者。

(更新:如果您寻找统计学哲学家的例子,而不是统计学从业者,捍卫S频率论者的观点,那么请阅读Deborah Mayo的著作;对@NRH的回答+1。)


更新:关于P频率和S频率之间的关系

@fcop和其他人询问P频率和S频率之间的关系。这些立场之一是否暗示着另一立场?毫无疑问,历史上 S频率论是基于P频率论立场而发展的。但是在逻辑上它们彼此暗示吗?

在讨论这个问题之前,我应该说以下。当我在上面写文章时,几乎没有P频率论者,我并不是说几乎每个人都是P主观的贝叶斯-拉-德-芬妮蒂(P-subjective-bayesian-a-la-de-finetti)或P-propensitist-a-la-popper。实际上,我相信大多数统计学家(或数据科学家或机器学习者)都不是P,而是完全闭嘴并计算(借用Mermin的名言)。大多数人倾向于忽略基础问题。很好。我们对自由意志,智慧,时间或爱没有很好的定义。但这不应该阻止我们从事神经科学,人工智能,物理学或坠入爱河。

就我个人而言,我不是S频率论者,但我对概率的基础也没有任何一致的看法。

p

因此,尽管@fcop在回答中说了什么,显然可以成为S频繁者而不是P频繁者。

好的。精细。但仍然:P贝叶斯能成为S频繁主义者吗?一个P频繁者可以成为S-贝叶斯主义者吗?

θ

要使一个确信的P频繁主义者成为S-贝叶斯主义者,可能会遇到问题。但是,要成为一个有说服力的P频繁主义者是很成问题的……


2
评论不作进一步讨论;此对话已转移至聊天
Glen_b

13

柯尔莫哥洛夫(Kolmogorov)在“概率论基础”上的工作在p.3中有“与实验数据的关系” 部分。这是他在那儿写的:

在此处输入图片说明

在此处输入图片说明

他正在展示如何通过观察实验来推导他的公理。这是解释概率的一种很常见的方式。

他对不可能发生的事件(空集)还有一个有趣的报价:

在此处输入图片说明

因此,我认为,如果您对这些论点感到满意,那么您必须承认自己是常客。该标签不是唯一的。您可以是双范式的(我做了这个词),即既是常客又是贝叶斯主义者。例如,当我将随机方法应用于非固有随机现象时,我就成为贝叶斯。

更新正如我之前在简历中所写,科尔摩哥罗夫的理论本身并不是常客。它与贝叶斯视图和常客视图一样兼容。他在本节中添加了这个可爱的脚注,以明确表明他对哲学的弃权:

在此处输入图片说明


1
多数公理系统都是通过“抽象”或“概括”现实世界的概念而得出的。“度量”的概念(公理)也是如此,他们研究了现实世界的概念(欧洲公证人距离)并“发现”了在度量空间中用作“公理”的三个属性。但是您的答案是正确的(+1),它表明Kolmogorov并未“空想”地“发明”他的公理,他开发了一种公理系统,该系统与当时对可支配性的理解有关。 。

1
您能否看一下@mpiktas对这个问题的评论,并说Kolmogorov亲自给出了这个定义?请参阅stats.stackexchange.com/questions/230415/…

2
@fcop,我记得他的回答。看起来很合理。绝对可以得出贝叶斯公理,而Kolmogorov在书中对此进行了说明。
阿克萨卡(Aksakal)

1
+1正是我在对相关主题写评论时的想法(尤其是脚注)。也是@Aksakal的最后评论。
Graeme Walsh

1
@Aksakal:指您上面的评论:不是“他的”答案,而是我的:-)

8

我相信提到Deborah Mayo是很重要的,他撰写了博客Error Statistics Philosophy

我不会声称对她的哲学立场有深入的了解,但是正如Aris Spanos 在一篇论文中所描述的那样,错误统计的框架确实包含了被认为是经典的常客统计学方法。引用本文:

在误差统计方法的保护下,一种方法可能包括所有基于误差概率的标准方法,这些方法基于重复采样中的错误相对频率(通常称为采样理论常客统计学)

在同一篇论文的更深处,您可以读到:

对于误差,统计学家出现的概率不是衡量假设的确认或确信程度(实际的还是理性的),而是量化方法能够区分其他假设的频率以及检测错误的可靠程度。


2
+1,提到Mayo的博客做得好。她的确是支持常客主义统计数据的最直言不讳的统计哲学家。如今,互联网上的大多数其他言论都支持贝叶斯统计。
变形虫说恢复莫妮卡

6

nnAAAP(A)

P(A):=limn+nAn

不难看出,这个定义满足了Kolmogorov的公理(因为限制是线性的,另请参见贝叶斯与频频主义者的争论是否有任何数学基础?)。

为了给出这样的定义,他们必须“相信”这个限制的存在。因此,常客是那些相信此限制存在的人。

2016年3月31日编辑:关于S和P频繁性之间的区别

@amoeba在回答S频繁者和P频繁者时将其区别开来,其中P频繁者是我在上文中定义的频繁者类型,并且他还认为很难成为P频繁者,所以我添加了EDIT部分认为相反的说法是正确的;

我认为所有S频繁主义者都是P频繁主义者

@amoeba在S-frequentism部分中说:“此过程成功地包含了具有特定长期成功频率(特定概率)的真实。”θ

他在回答中还指出,P频繁者是稀有物种。

但是,他用来定义S频率的“长期成功频率”被他定义为P频率,因为它是对。P(CI^θ)

因此,根据他的定义,每个S频繁者也是P频繁者。因此,我得出的结论是,体育频繁的人并不像变形虫所主张的那样罕见。

还有更多;@amoeba还认为,S频率论者认为未知的参数是固定的或非随机的,因此不能谈论“的概率具有特定价值”,他说θθθ

``我们唯一能做的就是提出一个围绕估计值构建一定间隔的程序,以使该程序成功地包含具有特定长期成功频率(特定概率)的真实 。''θ

我可以问一下“ frequentist”这个名字的由来吗:(a)“非随机 ”-想法或(b)“长期运行”-想法?θ

我也可以问@mpiktas,谁在评论变形虫的评论中写道:

''很难成为P频繁主义者,因为实际上不可能给出数学上合理的概率定义''

如果您需要定义P频率来定义S频率,那么怎么可能比P频率更多的S频率呢?


3
@Tim:为什么OLS会成为“常客”?

2
如果是这样的话,那么关于谁是常客的整个讨论似乎没有多大意义,因为他们的关注范围非常有限,而且统计领域也超出了他们的范围……(包括许多值得关注的领域)贝叶斯)。我想说的是,这似乎并没有被定义,因为它太狭隘。
蒂姆

2
做什么贝叶斯(自封的,或者仅仅是谁穿着自己的“贝叶斯帽子”的插曲实用主义者)认为是?limn+nAn
Silverfish

1
@Silverfish如果愿意,贝叶斯可以随意使用长期运行频率作为概率,只有常客没有选择。关键的区别是,贝叶斯可能会说,,但在推理我们感兴趣的是定义分布上的合理值我们从1E12观测获得。p ħ中号Ñ + ñ / Ñ p ħlimn+nA/npHlimn+nA/npH
迪克兰有袋博物馆,2016年

3
正是由于这个原因,概率论理论的基础,即对概率论的数学背景给出某些解释。现在,您想返回“惯常”定义并“重塑”概率。我发现这有误导性,因此我拒绝您的回答。欢迎您忽略此,这是网站的工作方式,始终存在分歧的可能性。
mpiktas

4

真有趣的问题!

在理解和解释概率陈述时,尽管考虑到需要一系列实际的iid实验来证明这一可能性,我并没有那么强硬,但我还是把自己放在了常客阵营中。我怀疑大多数不赞成“概率是信念的主观度量”的人也会以这种方式考虑概率。

这就是我的意思:拿我们通常的“公平”硬币,赋值。当我听到此消息时,我形成了一个有人多次抛硬币的图像,正面的比例接近。现在,如果按一下,我还要说的是,随着样本量的增加,来自这种硬币抛掷的有限序列的任何随机样本中的正面部分也将接近(独立假设)。0.5 0.5P(H)=0.50.50.5

正如其他人所说,最大的假设是该限制存在且正确(即限制为),但我认为同样重要的假设是,对于随机选择的子样本也存在相同的限制。否则,我们的解释仅对整个无限序列有意义(例如,我们可能具有很强的自相关性,因此会被平均掉)。0.5

我认为以上内容对于常客来说是毫无争议的。贝叶斯将更专注于手头的实验,而不是长期的行为:他们会说,他们对下一次抛头将是正面的信念是 ...句号。P(H)=0.5

对于抛硬币之类的简单情况,我们可以看到,尽管从哲学上讲非常不同,但常客和贝叶斯方法在功能上是等效的。正如Dikran Marsupial所指出的那样,贝叶斯实际上可能利用了这样一个事实:根据经验,我们看到硬币正面朝上的频率与我们看到硬币正面朝上的频率一样(长期运行/采样频率较高)。

那些不可能长期运行的东西呢?例如,朝鲜在未来10年内将对日本发动战争的可能性是多少?对于常客来说,我们真的处于困境,因为我们无法真正描述检验这种假设所需的抽样分布。贝叶斯将能够通过将概率分布放在可能性上来解决这个问题,最有可能是基于引起专家的意见。

但是,一个关键问题浮出水面:这些信念程度(或长期运行的假定值)从何而来?我会从心理学上争论,并说这些信念(尤其是在远离实验数据的领域中)来自所谓的可用性启发式表示性启发式。还有很多其他人可能会起作用。我之所以这样说是因为,在没有数据可以校准我们的信念(朝着观察到的长期频率!)的情况下,我们必须依靠启发法,无论我们使它们看起来多么复杂。

上述心理启发式思维同样适用于常客和贝叶斯主义者。对我来说有趣的是,无论我们的哲学是什么,从根本上讲,我们都相信某些我们认为更可能是真实的事物,并且我们认为它更有可能是真实的,因为我们相信还有更多的方法为了使它成为真,或者我们认为导致它成为真的途径比使它不成立的途径(经常:-)发生的频率更高。

既然是大选年,让我们举一个政治例子:我们将在声明中说“特德·克鲁兹将在未来4年内提出禁止突击步枪的禁令”。现在,我们确实从他自己的陈述中得到了一些数据,并且我们很可能将我们先前对这一陈述的真实性的信念非常接近于零。但为什么?为什么他的先前声明使我们这样想?因为我们认为,具有高度意识形态的人比“实用主义”的人更倾向于“坚持不懈”。这是从哪里来的?可能是由心理学家进行的研究以及我们与高度原则化的人的经验结合而成。

换句话说,我们有一些数据和信念,对于像克鲁兹这样的人在大多数情况下可以改变主意的情况,他们不会这样做(再次,是长期的或大样本的各种评估)。

这就是为什么我与常客们“讨论”的原因。这并不是我不喜欢贝叶斯哲学(非常合理)或方法(它们很棒!),但是如果我深入研究为什么我持有缺乏强大的大样本支持的信念,我会发现我在某种程度上依赖可以计算(如果隐含)结果或可以在特定子过程中调用长期概率的心理模型(例如,共和党人X%的时间对枪支管制措施投反对票)以一种或另一种方式加权我的信念。

当然,这不是真正的频率偏高,我怀疑有很多人赞成冯·密斯式的字母概率解释。但是,我认为它表明了贝叶斯概率和频繁概率之间的潜在兼容性:两者都吸引了我们关于可用性的内在启发法,或者我称之为因果链上的频率的“帕钦科”原理。

因此,也许我应该称自己为“可用性专家”,以表示我是根据我可以多久将事件想象为一系列事件的结果(当然有一些严格/建模)来分配概率的。如果我有很多数据,那就太好了。如果我不这样做,那么我将尝试将假设分解为一系列事件,并使用我拥有的数据(根据需要是轶事或“常识”)来评估我想象这种事件发生的频率。

抱歉,冗长的帖子,顺便问一个问题!


1
您对主观主义的概率方法进行了极大的简化。我同意心理学会在您处理数据的方式中发挥作用,但是您也可以采用常客主义的方法进行主观偏见的分析。一些贝叶斯主义者认为,在贝叶斯案例中,至少您要使主观信念明确化,而不是无视它们。
蒂姆

1
@Tim我并不是说常客是更​​客观的(有关常客的主要假设,请参阅我的第一部分。)此外,我要指出的是,常客和贝叶斯主义者都将自己的概率建立在他们对某事发生频率的信念上,或需要做多少件事(以及这样做的可能性)。

1
@Tim,因为这本身不是关于贝叶斯主义与频率主义的文章,所以我怀疑我是否给出了他们的建议……这将占用大量页面空间!从根本上讲,我们在考虑概率时都依赖于心理启发法,这些启发法使我们想到某些类型的事件能够比其他事件“以更多方式”发生或在“因果网络中更容易获得”。

1
@Tim OK ...当我从对贝叶斯主义的(简短的)讨论过渡到我的主要观点时,我添加了一些语言说明。

4

正如@amoeba所注意到的,我们有概率论的频繁定义和统计学。到目前为止,我所看到的所有消息来源都表示,频繁推断是基于概率的频繁定义,即将其理解为无限制随机抽取的比例极限(正如@fcop@Aksakal引述Kolmogorov所注意到的那样

P(A)=limnnAn

因此,基本上,有一些人口的概念可以重复地从中抽样。频繁推断中使用了相同的想法。我浏览了一些经典的论文,例如Jerzy Neyman的论文,以追踪频率论者统计学的理论基础。内曼在1937年写道

ia)统计学家与人口,由于某种原因或其他原因,无法详尽地研究。只能从该总体中抽取一个样本,然后对该样本进行详细研究并用于形成对描述总体的某些常数的值的看法。例如,可能希望近似地计算通过形成群体中的个体所具有的特定字符的平均 等 (IBπ π ππππ
)或者,统计学家可能会关注某些实验,如果在明显相同的条件下重复进行,则会得出不同的结果。daccess-ods.un.org daccess-ods.un.org这种实验被称为随机实验。
在上述两种情况下,统计学家面临的问题是估计问题。这个问题在于确定对观测数据应执行哪些算术运算以获得结果(称为估计值),该估计值与总体数字的数值特征的真值相差不大 ,如(ia)中所述,或随机实验,如(ib)中所述。[...] 在(iaπ
)我们说的是统计学家从所研究的人口中抽取样本。

在另一篇论文中(Neyman,1977),他注意到需要通过观察所研究现象的重复性质来验证数据中提供的证据:

通常,对一个猜测模型的“验证”或“验证”在于在先前没有经验研究的情况下推论其频繁出现的后果,然后进行适当的实验以查看其结果是否与预测一致。通常,验证的第一次尝试是负面的:实验中各种结果的观测频率与模型不一致。但是,在某些幸运的情况下,人们达成了合理的协议,并且至少在某种程度上,人们对“理解”这一现象感到满意。后来,总是出现新的经验发现,表明原始模型的不足,并要求放弃或修改。这就是科学的历史!

内曼和皮尔森(Neyman and Pearson,1933年)在另一篇论文中写到了从固定人口中抽取的随机样本

在通常的统计实践中,当观察到的事实被描述为“样本”,并且假设与“人口”有关时,就已经为其抽取了样本,这些样本的特征或者我们称之为它们的标准,即用于检验假设的东西,似乎经常被幸福的直觉所固定。

在这种情况下,频繁的统计数据将收集证据的科学推理形式化,然后抽取新的样本来验证最初的发现,并且随着我们积累的证据越来越多,我们的知识状态就越明确。再次,如Neyman(1977)所述,该过程采取以下步骤

i)凭经验建立明显稳定的长期相对频率(或简称为“频率”)事件,这些事件被认为很有趣,因为它们是自然发展的。
ii)猜测然后验证“机会机制”,其反复操作会产生观察到的频率。这是“频率概率论”的问题。有时,此步骤被标记为“模型构建”。自然地,猜测的机会机制是假设的。
iii)利用所研究现象的假设机会机制,推论出根据观察值调整我们的行动(或“决定”)的规则,以确保“成功”的最高“量度”。[... “调整行动规则”的问题是数学问题,特别是数学统计问题。

经常有人计划研究时要考虑到数据的随机性和从固定人口中反复抽取的想法,他们根据数据设计方法,并用其验证结果(Neyman和Pearson,1933年),

在不希望知道每个单独的假设是对还是错的情况下,我们可能会寻求规则来控制我们关于它们的行为,然后确保从长远来看,我们不会经常犯错。

这与重复采样原理有关(Cox和Hinkley,1974):

(ii)强重复抽样原则
根据强重复抽样原则,应根据统计程序在相同条件下的假设重复行为来评估统计程序。这有两个方面。不确定性的度量应解释为长期重复中的假设频率;最佳标准应根据假设重复中的敏感行为制定。
这样做的理由是,它确保了我们计算出的数量的物理意义,并且确保了我们所做的分析与被视为代表“真实”事务状态的基础模型之间的紧密联系。

(iii)弱的重复采样原理重复采样原理
的弱版本要求我们不要遵循某些假设参数重复会在大多数情况下产生误导性结论的程序。

相比之下,当使用最大似然时,我们将关注所拥有的样本,在贝叶斯案例中,我们将基于样本先验进行推断,并在出现新数据时执行贝叶斯更新。在这两种情况下,重复采样的想法都不是至关重要的。频率论只依靠他们(如注意到了数据@WBT),但记住,这是随机的东西,它被认为是重复采样的过程从人口(召回的一部分,例如,如何自信间隔已定义)。

在频繁出现的情况下,重复采样的想法使我们能够量化不确定性(在统计中),并使我们能够根据概率来解释现实事件。


附带说明一下,请注意,内曼(Lehmann,1988)和皮尔逊(Mayo,1992)都不像我们想象的那样纯净。例如,Neyman(1977)建议使用经验贝叶斯和最大似然法进行点估计。另一方面(Mayo,1992年),

在皮尔森(1955)对费舍尔(以及他的工作中的其他地方)的回应中,对于科学背景,皮尔逊既拒绝了长期误差概率低的基本原理,也拒绝了[...]

因此,即使在开国元勋中似乎也很难找到纯粹的常客。


Neyman,J和Pearson,ES(1933)。关于统计假设最有效检验的问题。皇家学会的哲学交易A:数学,物理和工程科学。231(694–706):289–337。

Neyman,J.(1937年)。基于经典概率论的统计估计理论的提要。菲尔 反式 R. Soc。nd 答:236:333-380。

Neyman,J。(1977)。频繁概率和频繁统计。合成,36(1),97-131。

梅奥(DG)(1992)。皮尔逊是否拒绝尼曼-皮尔逊的统计哲学?合成,90(2),233-262。

Cox,DR和Hinkley,DV(1974)。理论统计。查普曼和霍尔。

Lehmann,E。(1988)。杰里·内曼(Jerzy Neyman),1894年-1981年。技术报告第155号。加利福尼亚大学统计系。


1
+1(已经有几天了)。感谢您撰写本文,这里有一些不错的引用,引用列表非常有用。反过来,我现在在几个地方更新了我的答案,但主要是在最后,以澄清我所看到的P频率和S频率之间的关系。我当然同意,正如您在这里所说,从历史上讲,S频率是建立在P频率概念之上的,但是我认为它们不一定必然相互联系。
变形虫说恢复莫妮卡

4

让我提供一个答案,将这个问题与当前和非常实际的重要性(精确医学)联系起来,同时按要求回答字面上的问题:谁是常客?

经常说话的人会说诸如[1](强调我的意思)之类的话:

在未来十年内发生事件的10%的风险对产生事件的个人意味着什么?与所认为的相反,此风险级别不是该人的个人风险,因为概率在个别情况下没有意义

因此,常客以这样的方式解释“概率”,即它在像单个患者一样的单一上下文中没有任何意义。我的PubMed Commons评论 [1]考察了其常任作者在恢复适用于个别患者护理的类似似然概念时必须经历的扭曲。观察他们如何以及为什么这样做,对于谁是常客是很有启发性。另外,在《JAMA信件》 [2,3]部分中,大部分没有启发性的后续交流对于明确认识概率论中的局限性并直接攻击它们的重要性也具有指导意义。因此。(令我遗憾的是,许多简历用户可能会发现[1]位于付费墙后面。)

L.乔纳森·科恩L. Jonathan Cohen)所著的极佳且易读的书[4] 将偿还任何对OP的问题感兴趣的人的努力。值得注意的是,[1]奇怪地引用了科恩的书,并声称“概率在个别情况下是没有意义的”,尽管科恩清楚地接受了以下观点[4,p49]:

频率理论家也不能声称所有重要概率的确是通用的,而不是单数的。能够计算出自己孩子的阑尾切除术成功的可能性似乎非常重要。


1] Sniderman AD,D'Agostino Sr RB和Pencina MJ。“医师在预测分析时代中的作用。” JAMA 314,否。1(2015年7月7日):25-26。doi:10.1001 / jama.2015.6177。考研

2] Van Calster B,Steeerberg EW和Harrell FH。“个人风险预测”。JAMA314,否。17日(2015年11月3日):1875-1875年。doi:10.1001 / jama.2015.12215。全文

3] Sniderman AD,D'Agostino Sr RB和Pencina MJ。“针对个人的风险预测-答复。” JAMA 314,否。17(2015年11月3日):1875–76。doi:10.1001 / jama.2015.12221。全文

4]科恩,L。乔纳森。归纳和概率哲学概论。牛津:纽约:克拉伦登出版社;牛津大学出版社,1989年。链接到扫描的第46-53和81-83页



我喜欢这样的说法:“风险可以被认为是一个人“相信”或“准备赌注”某种疾病或事件发生的主观水平,2就像对未来一次事件的赌注一样在体育比赛中”。感谢您的输入和参考。
蒂姆

2
看起来是个不错的答案,但我有些困惑。我相信常客对程序(实验)感到担忧,从理论上讲,该程序可以运行无数次。并不意味着他们不能对下一次抛硬币做出预测,仅是他们的担忧/保证集中在过程上。没错,他们会说“美国将在今年赢得世界杯”不是他们能说的话,而是他们不能说您的孩子的阑尾切除术-从某种意义上说这是独一无二的,但是在孩子不是。
韦恩

@Tim,感谢您提供的链接,其中包括[2]和[3]。我已经相应地更新了答案的文字。
David C. Norris

2
@韦恩,我建议上述变形虫的答案(通常与“概率的频次视图”相关联的统计程序该频次视图本身之间的区别)可以回答您的评论。人们可能会使用常客主义的统计程序,但仍以基准或主观主义的方式解释使用由此产生的概率。只需将P值解释为“原假设成立的可能性”,就可以将其视为永久错误。
David C. Norris

3

XKCD的 “ Frequentists vs. Bayesians” (在CC-BY-NC 2.5下),单击以讨论:

'探测器! 如果我问他,贝叶斯统计学家会怎么说? 真的,你的大脑掉了吗? [卷]“ ...是的。”

此处说明的常人主义哲学的基本观点是一种信念,即仅根据(“纯粹”)观察数据得出有关事件的相对可能性的结论,而不会以预先构想的事物应该或如何构想“污染”该估计过程。不该是。在提供概率估计时,当存在可用于支持计算其经验似然性的观察结果时,常客不会考虑有关事件似然性的先前观点。在决定行动或结论的门槛时,常客应该考虑这些背景信息。

正如Dikran Marsupial下面的简明评论中所写的那样,“卡通(也许是无意间)提出的宝贵观点是科学的确更加复杂,我们不能不考虑先验知识就直接应用“无效仪式”。”

再举一个例子,当试图确定/声明Facebook上哪些主题正在“流行”时,常客可能会欢迎Facebook正在转向更纯粹的算法计算方法,而不是原来的旧模式,即员工会部分根据自己的个人来整理列表关于他们认为“应该”最重要的主题的背景观点。


10
-1。我喜欢XKCD,但是如果没有任何评论,恐怕这只会在该线程中产生误导。而且,需要大量评论才能正确解释与该漫画有关的问题。如果您提供适当的讨论,我将删除下注。
变形虫说恢复莫妮卡

4
频率论者的方法没有预先设想的概念是不正确的,它们被编码在具有统计意义的阈值中。对于ISTR,Fisher会根据实验的性质对此进行引用。这完全是漫画中的常客问题,他们只是没有为设置适当的值,因为他们没有考虑到有关该问题的“先验知识”(太阳极不可能出现新星),并且相应地调整了测试。使用95%所有的时间是备受批评的“零仪式”的一部分。α
迪克兰有袋博物馆,2016年

4
“空仪式”是对常客主义统计数据的不好应用,但对于频频主义本身并不是问题。
迪克兰有袋博物馆,2016年

2
@Dikran您的评论似乎(错误地)等同于“ Frequentist”与“ NHST的用户”。我一直在担心那种混乱。
ub

3
@luchonacho FWIW还有这里的XKCD卡通的讨论stats.stackexchange.com/questions/43339/...的可贵之处卡通(也许是无意的),使的是,科学的确是比较复杂的,我们不能只适用于“空仪式”而无需考虑先验知识。
迪克兰有袋博物馆,2016年

3

(备注仅与问题和站点相关)。

概率是关于单个事物的客观状态。事物不可能有意图,它们会从宇宙中获得地位。对于某件事,一个事件(赋予它的状态)总是会发生的:该事件已经完成了,即使它尚未真正发生-事物的过去,也称为“命运”或偶然性。

同样,对于概率的事实,事件的-已经发生尚未与否,并不重要- 已经在那里[作为反对的意思,从来没有有] 因此,它已经变得不必要和多余了。这个事实应该被丢弃,而它的无效就是我们所说的“事件很可能发生”。关于事物的任何事实本身都具有其原始的令人信服的一面,即事实的可能性(甚至是实际发生的事实-我们通过难以置信挑剔认识到它)。我们不可避免地在某种程度上从心理上“累了”。因此,只需要量化事实的部分否定(如果需要一个数字)。量化的一种方法是计数。另一个是称重。一个常客对他进行一系列的尝试,或者想像一下,他转过脸来看看事件是否真的发生了;他数。一个贝叶斯人考虑了一系列心理动机,拖延了他的行为,使其受到筛查。他把它们当作东西称重。两人都忙于充电/借口游戏。从根本上说,它们之间没有太大区别。

可能性在世界上的潜力有关。可能性永远是我的(下雨的机会是我选择撑伞或弄湿的问题),而不是一个对象(我正在考虑可能或有可能的对象),而是整个世界。可能性始终是50/50,并且总是令人信服的,因为它暗示着-无论是在之前要求还是在之后要求-我决定如何表现。事物本身没有意图,因此没有可能性。我们不应将我们对这些事物的可能性与它们自己的“随机确定性”可能性相混淆。就人类而言,概率绝不能是“主观的”。


细心的读者可能会在响应中对这个线程中的一个聪明的答案感到被掩饰的挖洞,@ amoeba说他认为"there are almost no frequentists of the [probability definition] kind (P-frequentists)"。可能相反:贝叶斯概率定义器不存在为不同的类。因为,正如我已经承认的那样,贝叶斯主义者认为现实的倾向与常客一样,是一系列事实。只有这些事实不是实验,是“真相”和“论据”的较早回忆。但是,这种形式的知识是事实,只能计数或衡量。除非人类期望,否则它竖立的概率不是主观的,预期的(“贝叶斯”为)(可能)进入场景进行干预。并且@amoeba焦急地让它进入“想象中,硬币将磨损而太阳将成为超新星”。


0

哦,多年来,我一直是常客,
而且我花了所有的时间来聆听数据,
但是现在我回到了贝叶斯,
那里存储得很好,而且我再也不会再玩常客了。

因为这永远不会拒绝,永远不会拒绝,不再,
我会扮演常客,永远不会,不再!

我去了曾经咨询过的实验室。
那个给了我一些数据,说“为我们p”,
我说“没有办法,何塞”带着微笑,
P值和明显的只是不调和!

合唱

我说这是您的先决条件,我们
的眼睛睁开,研究员高兴地睁开眼睛,
他说:“我的先前观点和其他观点一样好,
并且可以肯定,贝叶斯因素是最有效的方法!”

合唱

我将回到我的老师那里,承认我的所作所为,
并请他们原谅他们的浪子,
但是当他们像以前那样原谅我时,
我再也不会扮演常客了!

合唱

而且,不,永远不,永远不再,
我会扮演常客,永远,永远!

资料来源:AE Raftery,在BP Carlin编辑的《贝叶斯歌集》中,网址http://www.biostat.umn.edu/。演唱了《狂野漫游者》的传统民谣。引用开放大学M347数理统计,第9单元。



同意@Tim和-1,因为我不认为这会增加当前的讨论。
变形虫说恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.