我正在查看有关数据科学课程的一些演讲幻灯片,可以在这里找到:
https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf
不幸的是,我无法观看此讲座的视频,并且在幻灯片上的某个位置,演示者具有以下文本:
一些关键原则
像贝叶斯一样思考,像常客一样检查(和解)
有人知道这实际上意味着什么吗?我觉得从这可以收集到关于这两种思想流派的深刻见解。
我正在查看有关数据科学课程的一些演讲幻灯片,可以在这里找到:
https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf
不幸的是,我无法观看此讲座的视频,并且在幻灯片上的某个位置,演示者具有以下文本:
一些关键原则
像贝叶斯一样思考,像常客一样检查(和解)
有人知道这实际上意味着什么吗?我觉得从这可以收集到关于这两种思想流派的深刻见解。
Answers:
贝叶斯统计学派和常识派之间的主要区别是由于对概率的解释不同。贝叶斯概率是关于个人相信事件将(或已经)发生的陈述。频繁发生概率是关于随着事件数量增加而在极限内发生的类似事件的比例的陈述。
对我来说,“像贝叶斯一样思考”意味着在出现新信息时更新您的个人信念,而“像常客一样检查[或担心]”意味着关注统计程序在使用过程中的综合使用情况,例如,可信区间的覆盖范围是多少,I / II类型的错误率是多少,等等。
贝叶斯统计总结了信念,而常客统计总结了证据。贝叶斯认为概率是一种信念。这种包容性和生成性的推理类型对于提出假设很有用。例如,贝叶斯人可能可以任意分配某种可能性给月球是由绿色奶酪制成的概念,而不管宇航员是否实际上已经能够去那里验证这一点。这个假说也许得到了月球遥远的想法的支持。看起来像绿色奶酪。惯常论者不能单凭一个假想,而不是一个稻草人,也不能说证据支持一个假说比另一个假说。即使最大似然也只能生成“与观察到的结果最一致”的统计信息。形式上,贝叶斯统计允许我们跳出框框思考并从数据中提出可辩驳的想法。但这严格是自然产生的假设。
频率统计最好用于确认假设。当实验进行得很好时,常客统计学会通过避免先验来为发现提供“独立的观察者”或“经验的”背景。这与卡尔·波普尔的科学哲学是一致的。证据的重点不是发布某种想法。大量证据与错误的假设相符。证据只能伪造信念。
先验的影响通常被认为是统计推理中的偏见。如您所知,我们可以弥补各种事情发生的原因。从心理上讲,许多人认为观察者的偏见是我们大脑先验的结果,这些先验使我们无法真正权衡所见。尊敬的母亲在沙丘上说“希望观察云”。波普尔提出这个想法很严格。
在我们这个时代一些最伟大的科学实验中,这具有重大的历史意义。例如,约翰·斯诺(John Snow)精心收集了霍乱流行的证据,并断然得出霍乱不是由道德剥夺引起的,并指出该证据与污水污染高度一致:请注意,他并未得出结论因此,斯诺的发现要早于细菌的发现,而对机理或病因学尚无了解。在《物种起源》中也有类似的论述。直到宇航员实际上降落在地面并收集了样本之后,我们才真正知道月球是否由绿色奶酪制成。到那时,贝叶斯后验者对其他可能性的可能性非常低,而常客最多只能说样品与除月尘之外的任何物质都高度不一致。
总而言之,贝叶斯统计适合于假设的产生,而频繁统计则适合于假设的确认。确保在这些工作中独立收集数据是现代统计学家面临的最大挑战之一。
Plenty of evidence is consistent with incorrect hypotheses
。
Per Cliff AB
对OP的评论,听起来好像他们正在走向经验贝叶斯哲学。贝叶斯思想主要有三大流派,而经验贝叶斯通常是通过常识性方法从数据中估计先验。这与报价不完全一致(这意味着贝叶斯先行提出,之后便出现类似常客的担忧),但我们不应忽视Cliff AB
的出色评论。
此外,曾经而且可能仍然存在着贝叶斯流派,认为您无需在贝叶斯过程后进行任何检查。更现代的思想将使用后验预测检查,也许报价所指的是这种双重检查方法。
同样,常客主义哲学关注的是程序,而不是数据推断。因此,也许这也是引用含义的线索。
在此数据科学课程的背景下,我对“像常客一样进行检查”的解释是,您可以根据保留的验证数据评估预测函数或决策函数的性能。“像贝叶斯一样思考”的建议表达了这样的观点,即从贝叶斯方法派生的预测函数通常会产生良好的结果。
听起来像“像贝叶斯一样思考,像常客一样检查”指的是统计设计和分析中的方法。据我了解,贝叶斯思维涉及对先前情况的某种信念(无论是实验上还是统计上),例如,四年级学生的平均阅读分数是每分钟80个单词,而某些干预措施可能会将其提高到每分钟90个单词。这些是基于先前研究和假设的信念。经常性的思维会根据(干预的)发现进行推断,以获得置信区间或其他统计数据,这些置信区间或其他统计数据是基于这些结果再次发生的理论和实际频率或概率(即“多么频繁”)。例如,干预后阅读得分可能是每分钟91个单词,其95%置信区间为每分钟85到97个单词,并且其相关的p值(概率值)与干预前得分不同。因此,在95%的时间里,干预后新的阅读成绩将在每分钟85到97个单词之间。因此,“像贝叶斯一样思考”-即理论化,假设,看先前的证据,并“像常客一样检查”-即这些实验结果多久发生一次,以及由于机会而不是干预。干预后,新的阅读分数将在每分钟85到97个单词之间。因此,“像贝叶斯一样思考”-即理论化,假设,看先前的证据,并“像常客一样检查”-即这些实验结果多久发生一次,以及由于机会而不是干预。干预后,新的阅读分数将在每分钟85到97个单词之间。因此,“像贝叶斯一样思考”-即理论化,假设,看先前的证据,并“像常客一样检查”-即这些实验结果多久发生一次,以及由于机会而不是干预。