首先应该教什么:概率或统计?


19

我刚以数学系的老师的身份加入。一家知名机构。我将在本科阶段教授“概率与统计”课程。该机构已经为该课程制定了课程提纲,对此我不太满意。在该课程表中,首先涵盖了统计信息,也缺少估计部分。我一直认为,在教授统计学之前,应该先教概率基础。有人可以对此发表意见吗?同样,对于在此课程中应涵盖的主题的建议也深表感谢。


3
在我看来,要获得统计技术背后的逻辑和直觉,就需要对概率有基本的了解(不一定是太数学的概念),这一事实证明了,大多数基本水平的统计资料都是从概率开始的。在我的商业本科课程中,我们也首先学习了概率论,然后是统计学。
rsl

4
是理论上的,还是应用统计上的..?无需详细介绍概率就可以考虑许多应用的统计信息。稍后,它也可能是概率和理论统计的理想选择。因此,它不一定是一个坏主意。
蒂姆

3
学生正在学习什么学位课程?他们是数学专业,还是主要向社会科学或商业等其他领域的学生提供课程?
罗伯特·朗·朗

@RobertLong:据说是机械的。学生和我们自己的数学专业学生将参加该课程。其他来自经济学。计算机科学专业的学生也可以参加。
Ashok

Answers:


22

这似乎不再是一个见仁见智的问题:世界似乎已经远远超越了传统的“讲授概率,然后讲授统计学方法来应用它”。要了解统计学教学的发展方向,请查看去年《美国统计学家》特别版中的论文标题列表(如下所示):其中没有一个涉及概率。

他们确实讨论了概率论的教学及其在课程中的作用。乔治·科布的论文及其回应就是一个很好的例子。以下是一些相关的报价:

现代统计实践的范围要比我们传统的基于概率的推理课程所认识的范围要广得多。

我们的教学落后于我们的实践数十年。我们的课程范式强调从频频倾向的形式推理,基于入门级的中心极限定理,或者在数学专业的课程中,基于少量的参数概率模型,这些模型适合于使用微积分得出的闭式解。半个世纪历史的课程与当代统计实践之间的差距继续扩大。

我的论点是……作为一种职业,我们才刚刚开始探索各种可能性。我们学科的历史也支持这一论点:与概率不同,一连串的数学,统计学从科学的土壤重新萌芽。

概率是一个臭名昭著的概念。直觉和形式治疗之间的差距可能比应用数学的任何其他分支都要大。如果我们坚持认为统计思维必须一定要基于概率模型,那么我们该如何使该要求与使中心思想“简单易行”并最大限度地减少“研究先决条件”的目标相协调?

作为思想实验,贯穿估算的基本概念和理论。请注意,几乎仅使用上学期演算就可以解释和说明所有这些方法,并且沿途引入了概率。

当然,我们希望学生学习微积分和概率,但是如果我们能够与所有其他科学知识一起为一年级学生教授本学科的基本概念,那就太好了。

还有更多这样的东西。您可以自己阅读;该材料是免费提供的。

参考文献

有关“统计和本科课程”的美国统计学家专刊(2015年11月)可在http://amstat.tandfonline.com/toc/utas20/69/4上获得

教会下一代统计专业的学生“思考数据”:统计学和本科课程特刊Nicholas J. Horton&Johanna S. Hardin DOI:10.1080 / 00031305.2015.1094283

仅仅翻新太迟了:我们需要从头开始重新思考我们的本科课程DOI:10.1080 / 00031305.2015.1093029

Google规模的教学统计Nicholas Chamandy,Omkar Muralidharan和Stefan Wager第283-291页DOI:10.1080 / 00031305.2015.1089790

统计研究的探索:一种向大学生公开进行真实数据分析的方法Deborah Nolan和Duncan Temple Lang DOI:10.1080 / 00031305.2015.1073624

超越正常:为大学生提供统计咨询服务的顶峰Byran J. Smucker和A. John Bailer DOI:10.1080 / 00031305.2015.1077731

在统计课程中注入真实数据体验的框架Scott D. Grimshaw DOI:10.1080 / 00031305.2015.1081106

在数学统计中促进概念理解的发展Jennifer L.Green和Erin E.Blankenship DOI:10.1080 / 00031305.2015.1069759

统计第二课程:实验的设计与分析?娜塔莉·布莱德斯(Natalie J.Blades),布鲁斯·沙阿尔杰(Bruce Schaalje)和威廉·克里斯滕森(William F.

面向本科生的数据科学课程:数据思考Ben Baumer DOI:10.1080 / 00031305.2015.1081105

统计课程中的数据科学:让学生“思考数据” J. Hardin,R. Hoerl,Nicholas J. Horton,D. Nolan,B. Baumer,O. Hall-Holt,P. Murrell,R. Peng,P罗伯特·D·坦普·朗和医学博士沃德DOI:10.1080 / 00031305.2015.1077729

使用基于在线游戏的模拟来增强学生对现实世界数据分析中实际统计问题的理解Shonda Kuiper和Rodney X. Sturdivant DOI:10.1080 / 00031305.2015.1075421

在整个本科课程中使用基于仿真的方法与反统计思维进行斗争Nathan Tintle,Beth Chance,George Cobb,Soma Roy,Todd Swanson和Jill VanderStoep DOI:10.1080 / 00031305.2015.1081619

教师应该了解的引导程序:本科统计学课程中的重采样Tim C. Hesterberg DOI:10.1080 / 00031305.2015.1089789

将统计咨询案例研究纳入时间序列入门课程中Davit Khachatryan DOI:10.1080 / 00031305.2015.1026611

开发新的跨学科计算分析本科课程:定性-定量-定性方法苏格兰Leman,Leanna House和Andrew Hoegh DOI:10.1080 / 00031305.2015.1090337

从课程指南到学习成果:计划级别的评估Beth Chance和Roxy Peck DOI:10.1080 / 00031305.2015.1077730

统计学专业本科生艾里安·阿曼达·摩尔和詹妮弗·卡普兰的课程评估DOI:10.1080 / 00031305.2015.1087331


3
(+1)我认为这是一个很好的回应。首先讲授概率论的问题是,给人的印象是统计学与概率模型的规范,拟合和诊断有关。这不仅只是统计数据的一小部分,而且在考虑数据时会跳过一些最基本的问题:如何形象化数据以及如何对其进行汇总。识别数据集位置的平均值或中位数的相对优势是什么?我们应该如何交叉列出我们的结果?哪些图形合适,它们告诉我们什么数据?
银鱼

@Silverfish,与像Bernoulli这样的人处理统计数据的方式如此不同。看看他的一篇漂亮的论文。他试图重新分析天花引起的死亡率以及预防接种天花的好处。他基本上从此开始了现代流行病学。如果他专注于您提到的内容(例如可视化等),那么他就不会将洞察力带入对底层过程的理解。
Aksakal

@Aksakal我并不是说建模并不重要,也不是说大量的概率论并不是至关重要的。但是统计数据远不止于此。我认为将概率论视为基础是错误的:或者在某种程度上说,这意味着必须首先进行讲授。人们可能在高中时第一次看到或这样的非理性数字,但他们没有通过Dedekind cuts进行介绍!对于没有数学优先背景的学生来说,了解数据是很容易获得的东西,并且找到模式比p值汤更重要。2π
银鱼

对于流行病学年初突破,我会养你斯诺的研究报告中的1854宽街霍乱疫情 -这在许多好书发现引入数据可视化,以及思维过程为这肯定属于在统计101的心脏
蠹虫

1
@Aksakal,我感谢您提到伯努利。但是,先驱者和伟大的数学家如何处理和解决问题与应如何讲解解决方案完全不同。我想强调一点,没有人(afaik)提倡不要讲授可能性:这个问题涉及在入门(大学)课程中应何时引入这些思想,以及应在多大程度上实行这些思想。首先引入许多统计思想的强烈的教学论理由(基于心理学和教学经验)。
ub

7

轶事的复数形式不是数据,但在我所见过的几乎所有过程中,至少概率论的基础要先于统计学。

另一方面,从历史上看,普通的最小二乘发现正态分布之前就已经开发出来的!统计方法是先有较为严格的,基于概率的理由,为什么它的作品名列第二!

史蒂芬·斯蒂格勒(Stephen Stigler)的统计史:1900年之前的不确定性的测度带给读者历史的发展:

  • 数学家,天文学家了解基本力学和重力定律。他们可以将天体的运动描述为几个参数的函数。
  • 他们还对天体进行了数百次观测,但是如何将这些观测结合起来以恢复参数呢?
    • 一百个观测值可以给您一百个方程式,但是如果只有三个未知数要解决,那么这是个超定的系统...
  • 勒让德(Legendre)首先开发出最小化平方误差之和的方法。后来,这与高斯和拉普拉斯概率的工作有关,在给定正态分布误差的情况下,普通最小二乘在某种意义上是最优的。

为什么要提出这个问题?

在建造房屋之前,一定要具备一定的逻辑上的优雅,以首先建立派生,理解某种方法以奠定基础所需的数学机制。

但是,在科学的现实中,房屋通常排在第一位,基础第二位:P。

我希望看到教育文献的成果。有什么更有效的教学方法?那为什么呢?还是为什么呢?

(我可能是一个怪人,但我发现了关于最小二乘方格如何发展成为令人兴奋的翻页机的故事!故事可以使原本无聊的抽象事物变得生动起来……)


2
统计教育文献在这个问题上似乎是一致且毫不含糊的:概率不是统计学,统计学远不只是概率,统计学(至少在K-12和大学级别)应该以对数据的思考而不是作为统计来引入。概率的应用。除了我在答案中提供的参考文献之外,还请查看其他一些免费的可用资源,例如CauseWebGAISEJ. Statistics Education
whuber

4

我认为对于大多数人来说,这应该是一个反复的过程:您学习一些概率,然后了解一些统计信息,然后了解更多的概率,再了解更多的统计信息,等等。

例如,查看GWU 的PhD Stat要求。博士学位级别概率课程8257具有以下简短描述:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

请注意,在先决条件下,它如何具有硕士水平统计课程6201和6202。如果您深入研究GWU中最低级别的统计或概率课程,您将获得商业和经济统计入门1051或社会科学统计学入门1053。这是其中之一的描述:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

注意,该课程如何具有“统计”标题,但它会教授其中的概率。对于许多人来说,这是高中“统计”课程之后第一次接触概率论。

这有点类似于我当时的教学方式:课程和教科书通常以“概率论与数理统计”为标题,例如Gmurman的课本

我无法想象在没有任何统计数据的情况下学习概率论。高于8257的博士学位水平的课程假定您已经知道统计信息。因此,即使您先讲授概率,也会涉及一些统计学习。这只是第一门课程,在统计上权衡一点,然后再用它来介绍概率论可能是有意义的。

最后,这是一个重复的过程,正如我在开始时所述。而且,在任何良好的迭代过程中,第一步都不重要,无论第一个概念是来自统计数据还是概率,在多次迭代后都无所谓:无论如何,您都将到达同一个地方。

最后,教学方法取决于您的领域。如果您正在学习物理学,则会得到诸如统计力学,费米-狄拉克统计之类的东西,而这些东西在社会科学中将不会涉及。同样,在物理学中,频频论者的方法是自然的,实际上它们是基于一些基本理论的。因此,尽早教授独立的概率论是有道理的,这与社会科学不同,在社会科学上花一些时间而不是在统计学上权衡些可能没有多大意义。


2
从表面上看,博士学位课程似乎对于如何向本科生教授一门学科几乎没有指导作用。目标和受众完全不同。我将添加一个个人说明:在与一些知名统计部门的互动中,我看到该课程反映了30年前的教学法和进阶思想,并将继续这样做,直到新一代教授接任为止。也许我们应该乐于将此类课程用作应该做的事情的规范模型。
whuber

1
@whuber然后课程表将反映当时已有30年历史的构想...但至少它们不会成为拥有60年历史的构想。据说,无论如何,科学在不断地向前发展。
Mark L. Stone
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.