您能说统计和概率就像归纳法和演绎法吗？

17

我已经阅读了该线程，在我看来可以这样说：

统计=归纳？
概率=扣除？

但是我想知道我所缺少的比较是否还有更多细节。例如，统计量等于归纳法，还是仅仅是其特殊情况？似乎概率是演绎的一个子案例（因为它是数学思维的一个子案例）。

我知道这是一个挑剔的问题，但是从某种意义上讲，这就是为什么我要问这个问题-因为我想确保如何准确比较这些术语。

probability theory

— 塔尔·加利利
source

不是因为它回答你的问题，而是因为它们连接：stats.stackexchange.com/questions/665/...（我真的很喜欢马克/彼得的答案）和stats.stackexchange.com/questions/2641/...

— 罗宾·吉拉德

15

我认为最好在回答您的问题之前快速回顾归纳和演绎推理的含义。

演绎推理：“演绎论证是试图表明结论必定来自一组前提。如果结论确实必须遵循前提，则演绎论证是有效的，即，如果前提为真，那么结论必须为真如果演绎论证有效且前提为真，则它是正确的。演绎论证是有效或无效，正确或不正确的，但绝不能为假或真实。” （引自维基百科，增加了重点）。
“归纳推理，也称为归纳或归纳逻辑，或口语中的有根据的猜测，是一种推理，即使在所有前提都成立的情况下，也可能得出结论是错误的。归纳逻辑论证的前提指出结论的某种程度的支持（归纳概率），但不包含结论；也就是说，它们不能确保结论的真实性。 ”（摘自Wikipedia，强调了）

强调主要差异：演绎推理将真理从前提转移到结论，而归纳推理则没有。也就是说，对于演绎推理，您永远不会扩展知识（即，所有内容都在前提中，但有时是隐藏的，需要通过证明来证明），而归纳推理则可以扩展知识（即，您可能会获得新的见解，但是，由于不知道其真实性而付出的代价）。

这与概率和统计有何关系？

在我看来，概率必然是演绎的。它是数学的一个分支。因此，根据一些公理或思想（假设是真实的），可以推论理论。

但是，统计数据不一定是归纳法。仅当您尝试使用它来生成有关未观察到的实体的知识时（即，进行推论统计，另请参阅onestop的答案）。但是，如果您使用统计数据来描述样本（即描述性统计数据），或者如果您对整个总体进行了抽样，则由于您无法获得样本中已经存在的更多知识或信息，它仍然是推论。

因此，如果您认为统计数据是科学家的英勇努力，他们试图使用数学方法来寻找规律来控制世界上经验实体的相互作用，那么这实际上是不会成功的（即，我们永远不会真正知道是否有任何方法我们的理论是正确的），那么，是的，这是归纳法。这也是弗朗西斯·培根（Francis Bacon）阐明的科学方法，现代经验科学就是在此基础上建立的。该方法得出的归纳结论充其量极有可能，尽管不确定。反过来，这导致非科学家对科学理论和科学证明的含义产生误解。

更新：在阅读《共轭先验》的回答后（经过一整夜的思考），我想添加一些内容。我认为关于（推理）统计推理是演绎还是归纳的问题取决于您真正感兴趣的是什么，即您正在寻求哪种结论。

如果您对概率结论感兴趣，那么统计推理就是演绎。这意味着，如果您想知道例如，在100个案例中的95个案例中，总体值是否在某个区间（即置信区间）内，那么您可以为该语句获取真值（真或不真）。您可以说（如果假设是正确的），就是在100个案例中有95个案例的总体值在区间内。但是，在没有经验的情况下，您都不会知道总体值是否在您获得的CI中。不管是不是，但是没有办法确定。同样的推理适用于经典p值和贝叶斯统计中的概率。您可以确定概率。

但是，如果您对有关经验实体的结论感兴趣（例如，人口价值在哪里），则只能争论归纳法。您可以使用所有可用的统计方法来收集证据，以支持有关经验实体或它们与之相互作用的因果机制的某些命题。但是您永远不会对这些命题有把握。

回顾一下：我想指出的一点是，这对于您的外观很重要。您可以推论出概率，但是对于事物的每个确定性命题，您只能找到有利的证据。不多。另请参阅onestop的归纳问题链接。

— 亨里克
source

谢谢Henrik-定义之间的区别（以及您对它们的想法）很有帮助。

— 塔尔·加利里

您的更新很明确并且很关键。如果可以再给您（+1），我会的。

— Tal Galili 2010年

7

统计是归纳的演绎方法。请考虑两种主要的统计推断方法：惯常方法和贝叶斯方法。

假设您是一个常客（以Fisher的风格，而不是Neyman的方便）。您想知道具有实质意义的参数是否具有特定值，因此您可以构建模型，选择与该参数有关的统计数据并执行测试。测试生成的p值表示看到的统计量等于或大于根据您所拥有的样本计算出的统计量得出的统计值的概率，前提是您的模型是正确的。您获得了足够小的p值，因此您拒绝了参数确实采用该值的假设。您的推论是推论的：假设模型是正确的，或者该参数确实确实具有实质性利益的价值，但是您看不到该样本的实质性价值，或者它实际上并未具有该价值。

从假设检验转到置信区间：您的参数有95％的置信区间，其中不包含实质性价值。您的推论再次是推论：假设模型是正确的，或者这是那些罕见的区间之一，当参数确实具有实质性的价值时（因为您的样本是不可能的），它将出现20次中的1次，或者参数实际上不具有该值。

现在假设您是贝叶斯（贝叶斯风格（采用拉普拉斯风格，而不是盖尔曼风格））。您的模型假设和计算为您提供了参数值的（后验）概率分布。该分布的大部分质量都与实质利益的值相去甚远，因此您可以得出结论，该参数可能没有该值。您的推理又是演绎性的：假设模型是正确的，并且如果先验分布表示您对参数的信念，那么根据数据对您的信念将由后验分布来描述，后验分布对该值的概率很小。由于此分布对实质利益的价值提供了很少的支持，因此您可能会得出结论，该参数实际上没有价值。（或者您可能很愿意陈述它的可能性）。

在这三种情况下，您都会得到逻辑上的析取关系，以根据假设从演绎/数学推导得出的行动。这些假设通常是关于如何生成数据的模型，但也可能是关于其他数量的先验信念。

— 共轭先验
source

1

谢谢Cp，您提出了一个有趣的观点。尽管从上述Henrik的答案的角度来看，您仍然处于归纳领域，因为您描述的统计推理涉及不确定性。

— 塔尔·加利利

请查看（希望可以理解的）我的答案的更新，在此我尝试解决此处提出的问题。

— 亨里克（Henrik）2010年

@Henrik（至少对我来说）更清楚。只是一点点麻烦：“经典p值和贝叶斯统计中的概率适用相同的推理”并非完全如此。后者将为您提供单个事件的概率，例如，真实均值介于某个值和某个其他值之间的概率（尽管您的其他警告都适用），而“经典”的频繁性方法（如置信区间）甚至不会这样做。希望他们这样做并产生广泛的希望。他们的解释确实如您所描述。

— conjugateprior 2010年

3

是! 也许统计数据并不严格等于归纳法，但我认为统计学是解决归纳法问题的方法。

— 1站
source