正如@amoeba所注意到的,我们有概率论的频繁定义和统计学。到目前为止,我所看到的所有消息来源都表示,频繁推断是基于概率的频繁定义,即将其理解为无限制随机抽取的比例极限(正如@fcop和@Aksakal引述Kolmogorov所注意到的那样)
P(A)=limn→∞nAn
因此,基本上,有一些人口的概念可以重复地从中抽样。频繁推断中使用了相同的想法。我浏览了一些经典的论文,例如Jerzy Neyman的论文,以追踪频率论者统计学的理论基础。内曼在1937年写道
(ia)统计学家与人口,由于某种原因或其他原因,无法详尽地研究。只能从该总体中抽取一个样本,然后对该样本进行详细研究并用于形成对描述总体的某些常数的值的看法。例如,可能希望近似地计算通过形成群体中的个体所具有的特定字符的平均
等
(IBπ π ππππ
)或者,统计学家可能会关注某些实验,如果在明显相同的条件下重复进行,则会得出不同的结果。daccess-ods.un.org daccess-ods.un.org这种实验被称为随机实验。
在上述两种情况下,统计学家面临的问题是估计问题。这个问题在于确定对观测数据应执行哪些算术运算以获得结果(称为估计值),该估计值与总体数字的数值特征的真值相差不大
,如(ia)中所述,或随机实验,如(ib)中所述。[...]
在(iaπ
)我们说的是统计学家从所研究的人口中抽取样本。
在另一篇论文中(Neyman,1977),他注意到需要通过观察所研究现象的重复性质来验证数据中提供的证据:
通常,对一个猜测模型的“验证”或“验证”在于在先前没有经验研究的情况下推论其频繁出现的后果,然后进行适当的实验以查看其结果是否与预测一致。通常,验证的第一次尝试是负面的:实验中各种结果的观测频率与模型不一致。但是,在某些幸运的情况下,人们达成了合理的协议,并且至少在某种程度上,人们对“理解”这一现象感到满意。后来,总是出现新的经验发现,表明原始模型的不足,并要求放弃或修改。这就是科学的历史!
内曼和皮尔森(Neyman and Pearson,1933年)在另一篇论文中写到了从固定人口中抽取的随机样本
在通常的统计实践中,当观察到的事实被描述为“样本”,并且假设与“人口”有关时,就已经为其抽取了样本,这些样本的特征或者我们称之为它们的标准,即用于检验假设的东西,似乎经常被幸福的直觉所固定。
在这种情况下,频繁的统计数据将收集证据的科学推理形式化,然后抽取新的样本来验证最初的发现,并且随着我们积累的证据越来越多,我们的知识状态就越明确。再次,如Neyman(1977)所述,该过程采取以下步骤
(i)凭经验建立明显稳定的长期相对频率(或简称为“频率”)事件,这些事件被认为很有趣,因为它们是自然发展的。
(ii)猜测然后验证“机会机制”,其反复操作会产生观察到的频率。这是“频率概率论”的问题。有时,此步骤被标记为“模型构建”。自然地,猜测的机会机制是假设的。
(iii)利用所研究现象的假设机会机制,推论出根据观察值调整我们的行动(或“决定”)的规则,以确保“成功”的最高“量度”。[... “调整行动规则”的问题是数学问题,特别是数学统计问题。
经常有人计划研究时要考虑到数据的随机性和从固定人口中反复抽取的想法,他们根据数据设计方法,并用其验证结果(Neyman和Pearson,1933年),
在不希望知道每个单独的假设是对还是错的情况下,我们可能会寻求规则来控制我们关于它们的行为,然后确保从长远来看,我们不会经常犯错。
这与重复采样原理有关(Cox和Hinkley,1974):
(ii)强重复抽样原则
根据强重复抽样原则,应根据统计程序在相同条件下的假设重复行为来评估统计程序。这有两个方面。不确定性的度量应解释为长期重复中的假设频率;最佳标准应根据假设重复中的敏感行为制定。
这样做的理由是,它确保了我们计算出的数量的物理意义,并且确保了我们所做的分析与被视为代表“真实”事务状态的基础模型之间的紧密联系。
(iii)弱的重复采样原理重复采样原理
的弱版本要求我们不要遵循某些假设参数重复会在大多数情况下产生误导性结论的程序。
相比之下,当使用最大似然时,我们将关注所拥有的样本,在贝叶斯案例中,我们将基于样本和先验进行推断,并在出现新数据时执行贝叶斯更新。在这两种情况下,重复采样的想法都不是至关重要的。频率论只依靠他们(如注意到了数据@WBT),但记住,这是随机的东西,它被认为是重复采样的过程从人口(召回的一部分,例如,如何自信间隔已定义)。
在频繁出现的情况下,重复采样的想法使我们能够量化不确定性(在统计中),并使我们能够根据概率来解释现实事件。
附带说明一下,请注意,内曼(Lehmann,1988)和皮尔逊(Mayo,1992)都不像我们想象的那样纯净。例如,Neyman(1977)建议使用经验贝叶斯和最大似然法进行点估计。另一方面(Mayo,1992年),
在皮尔森(1955)对费舍尔(以及他的工作中的其他地方)的回应中,对于科学背景,皮尔逊既拒绝了长期误差概率低的基本原理,也拒绝了[...]
因此,即使在开国元勋中似乎也很难找到纯粹的常客。
Neyman,J和Pearson,ES(1933)。关于统计假设最有效检验的问题。皇家学会的哲学交易A:数学,物理和工程科学。231(694–706):289–337。
Neyman,J.(1937年)。基于经典概率论的统计估计理论的提要。菲尔 反式 R. Soc。nd 答:236:333-380。
Neyman,J。(1977)。频繁概率和频繁统计。合成,36(1),97-131。
梅奥(DG)(1992)。皮尔逊是否拒绝尼曼-皮尔逊的统计哲学?合成,90(2),233-262。
Cox,DR和Hinkley,DV(1974)。理论统计。查普曼和霍尔。
Lehmann,E。(1988)。杰里·内曼(Jerzy Neyman),1894年-1981年。技术报告第155号。加利福尼亚大学统计系。