我正在帮助正在读中学的男孩们了解统计学,并且我正在考虑从一些简单的例子开始,而不必理会理论上的一些内容。
我的目标是给他们一种最直观但最有建设性的方法,以从头开始学习统计学,以激发他们对进一步追求统计学和定量学习的兴趣。
不过,在开始之前,我有一个特别的问题,它具有非常普遍的含义:
我们是否应该开始使用贝叶斯或常客制框架教授统计学?
到处进行研究,我发现一种常见的方法是从对常客统计学的简要介绍开始,然后再深入讨论贝叶斯统计(例如Stangl)。
我正在帮助正在读中学的男孩们了解统计学,并且我正在考虑从一些简单的例子开始,而不必理会理论上的一些内容。
我的目标是给他们一种最直观但最有建设性的方法,以从头开始学习统计学,以激发他们对进一步追求统计学和定量学习的兴趣。
不过,在开始之前,我有一个特别的问题,它具有非常普遍的含义:
我们是否应该开始使用贝叶斯或常客制框架教授统计学?
到处进行研究,我发现一种常见的方法是从对常客统计学的简要介绍开始,然后再深入讨论贝叶斯统计(例如Stangl)。
Answers:
贝叶斯统计和惯常主义统计都基于概率论,但我要说前者从一开始就更依赖于该理论。另一方面,一旦学生对概率的概念有了很好的理解,可信区间的概念肯定比置信区间的概念更直观。因此,无论您选择什么,我都主张首先加强对概率概念的理解,所有这些示例都基于骰子,纸牌,轮盘赌,蒙蒂·霍尔悖论等。
我会选择一种方法或另一种方法是基于纯粹的功利主义方法:他们是否更有可能在学校学习常客或贝叶斯统计学?在我国,他们一定会首先学习常识性框架(最后:从未听说过高中生被教给贝叶斯统计数据,唯一的机会是在大学或以后通过自学)。也许在您的与众不同。请记住,如果他们需要处理NHST(无效假设意义检验),那么在常客主义统计(IMO)的背景下,这自然而然地出现了。当然,您也可以在贝叶斯框架中检验假设,但是有很多著名的贝叶斯统计学家主张在频率论者框架或贝叶斯框架下根本不使用NHST(例如,哥伦比亚大学的Andrew Gelman)。
最后,我不知道您所在国家的高中生的水平,但是在我的学生中,学生很难同时成功地吸收概率论和积分学。因此,如果您决定使用贝叶斯统计,那么我真的会避免连续随机变量的情况,而要坚持使用离散随机变量。
贝叶斯和常客提出不同的问题。给定观察到的数据,贝叶斯询问哪些参数值是可信的。如果某些假设参数值是正确的,则常问者会询问虚拟仿真数据的可能性。频繁决策是由控制错误引起的,贝叶斯决策是由模型描述的不确定性引起的。
那么,您应该首先教哪个?好吧,如果这些问题中的一个或另一个是您首先要问的问题,那就是您的答案。但是就可及性和教学法而言,我认为贝叶斯方法更容易理解,也更直观。贝叶斯分析的基本思想是将信誉重新分配给各种可能性,就像福尔摩斯(Sherlock Holmes)所说的那样,成千上万的读者已经直观地理解了这一点。但是,频繁主义者分析的基本思想非常具有挑战性:如果特定假设为真,则可能发生的所有可能数据集的空间,以及那些具有摘要统计量大于或等于摘要的虚构数据集的比例实际观察到的统计信息。
关于贝叶斯思想的免费介绍章节在这里。文章说,台频率论者和贝叶斯概念并排是在这里。这篇文章解释了假设检验和估计(以及很多其他东西)的常客和贝叶斯方法。本文的框架对于尝试了解情况的初学者可能特别有用。
这个问题有可能基于观点,因此我将尽我的见解,然后给您本书的建议。有时值得采用特殊的方法,因为这是一本特别好的书所采用的方法。
我同意贝叶斯统计更直观。置信区间与可信区间的区别几乎可以概括为:人们自然地以“……的机会是什么”而不是置信区间的方式来思考。置信区间方法听起来很像是在说与可信区间相同的东西,只是根据一般原则,您不能从“ 95%的时间”到“ 95%的机会”采取最后一步,这似乎非常频繁,但是您做不到。这并不是矛盾,只是不直观。
可以解决的事实是,他们将上的大多数大学课程都将使用不太直观的常识性方法。
那就是说,我真的很喜欢Richard McElreath 所著的《统计反思:R和Stan中的贝叶斯课程示例》。它并不便宜,所以在购买之前,请先阅读它并在亚马逊上戳一下。我发现这是一种特别直观的方法,它利用了贝叶斯方法,非常实用。(由于R和Stan是用于贝叶斯统计的出色工具,并且它们是免费的,因此这是一种实用的学习方法。)
编辑:一些评论提到,即使有经验丰富的导师,这本书也可能超出了高中生的水平。因此,我不得不提出一个更大的警告:它在一开始就采用了一种简单的方法,但是很快就可以解决。这是一本非常了不起的书,但是您真的必须在Amazon上仔细阅读一下,才能初步了解其假设以及其增长速度。美丽的类比,R中出色的动手工作,令人难以置信的流程和组织,但对您可能没有用。
它假定您具有编程和R(免费的统计软件包)的基础知识,并且具有一定的概率和统计基础。这不是随机访问,并且每一章都建立在前几章的基础上。它的开始非常简单,尽管难度确实在中间增加了—结束于多级回归。因此,您可能想在Amazon上预览其中的一些内容,并确定您是否可以轻松了解基础知识,或者它是否跳得太远了。
编辑2:我在这里所做的贡献的底线是,尝试从纯粹的观点中将其转变为一本好的教科书可以决定您采用哪种方法。我更喜欢贝叶斯方法,而这本书做得很好,但步伐可能太快了。
首先,我被教为常客制,然后是贝叶斯制。我不是专业的统计学家。
我必须承认,我没有发现我对频繁主义者方法的先前知识对理解贝叶斯方法有决定性的帮助。
我敢说这取决于您接下来将向学生展示哪些具体的应用程序,以及您将在这些应用程序上花费多少时间和精力。
话虽如此,我将从贝叶斯开始。
没有人提到可能性,这是贝叶斯统计的基础。赞成先教贝叶斯的观点是,从概率到可能性再到贝叶斯的流程是无缝的。可以通过以下方式从贝叶斯激发贝叶斯:(i)似然函数看起来(和作用)类似于概率分布函数,但这不是因为曲线下的面积不是1.0,并且(ii)粗略的常用Wald区间假设似然函数与正态分布成正比,但是贝叶斯方法可以轻松克服此限制。
另一个赞成贝叶斯的论点是,如其他人所提到的,可以更容易地解释关于p值的P(A | B)与P(B | A)关系。
赞成“贝叶斯优先”的另一个论点是,它迫使学生更仔细地考虑条件概率模型,这在其他地方很有用,例如在回归分析中。
很抱歉自我推广,但是由于它完全是话题,我不介意指出这正是我和凯文·亨宁(Keven Henning)在我们的书《理解高级统计方法》(https://peterwestfall.com)中采用的方法。 wixsite.com/book-1),其目标受众是非统计学家。
您是为了娱乐和洞察力还是实际用途而教学?如果是关于教学和理解,我会去贝叶斯。如果出于实际目的,我肯定会去常客。
在自然科学的许多领域(我想是大多数领域)中,人们习惯于用p值发表论文。您的“男孩”在开始撰写自己的论文之前,必须先阅读别人的论文。要阅读其他人的论文,至少在我的领域中,他们需要理解空值假设p值,无论它们在贝叶斯研究之后可能显得多么愚蠢。即使他们准备发表第一篇论文,他们也可能会邀请一些高级科学家来领导该团队,并且有可能,他们更喜欢频繁性。
话虽这么说,我想同意@Wayne的观点,因为对统计的重新思考显示了一种将贝叶斯统计作为第一种方法而不是基于现有的关于频率论的知识的非常清晰的方法。本书不试图说服您接受更好或更糟糕的统计数据,这是很棒的。作者对贝叶斯的陈述是(IIRC),他一直在教授这两种,贝叶斯更容易教。
我会远离贝叶斯,跟随巨人。
苏联为中学生编写了一系列精彩的书籍,这些书籍被粗略地翻译成英文,称为“'量化'小图书馆”。柯尔莫哥洛夫(Kolmogorov)与合著者共同撰写了一本书,名为“概率论概论”。我不确定它是否曾经被翻译成英文,但是这里是其俄罗斯原文的链接。
他们通过组合学来解释概率,我认为这是一个很好的起点。这本书对于一个数学不错的高中生来说非常容易读懂。请注意,苏联人相当广泛地教授数学,因此,我认为,普通的西方高中学生可能没有做好充分的准备,但只要有足够的兴趣和意志,他们仍然可以处理这些内容。
内容对学生来说非常有趣,它具有随机游走,限制分布,生存过程,大量定律等特点。如果将此方法与计算机模拟结合起来,它将变得更加有趣。