教学抽样分布的策略

30

tl; dr版本 您采用了哪些成功的策略在入门级本科水平上教授（例如，样本均值的）样本分布？

背景

9月，我将使用David Moore 撰写的《统计基础知识》为二年级社会科学（主要是政治科学和社会学）课程的学生开设统计学入门课程。这是我第五次教这门课，我一直遇到的一个问题是，学生们确实在抽样分配的概念上挣扎。它作为推理的背景进行了介绍，并基本介绍了几经打initial后他们似乎没有遇到麻烦的概率（而从根本上讲，我的意思是基本-毕竟，这些学生中的许多人已经被自动选入了特定的课程流，因为他们试图避免甚至带有“数学”含糊暗示的任何事物。我猜想可能有60％的人对课程没有一点点的了解，大约25％的人了解原理，但不了解与其他概念的联系，其余15％的人完全理解。

主要问题

学生似乎遇到的麻烦是应用程序。除了说他们只是不明白之外，很难解释确切的问题是什么。从上学期进行的一项民意测验和考试答复中，我认为部分困难是两个相关且相似的发音短语（采样分布和样本分布）之间的混淆，因此我没有使用“样本分布”一词虽然如此，但可以肯定的是，虽然一开始令人困惑，但只需一点点努力就可以轻松解决它，并且无论如何也无法解释抽样分布概念的普遍困惑。

（我意识到这可能是我本人和我的教！在这里！但是，我认为忽略不合理的可能性是合理的做法，因为有些学生确实做到了，而且总体上每个人似乎都做得不错...）

我尝试过的

我不得不与我们系的本科生管理者争论，在计算机实验室中引入强制性课程，以为反复演示可能会有所帮助（在我开始教这门课程之前，不涉及计算）。虽然我认为这有助于总体上理解课程材料，但我认为这对特定主题没有帮助。

我曾经有过一个想法，就是根本不教它或不给它太多分量，这是某些人（例如安德鲁·盖尔曼）所主张的。我觉得这不是特别令人满意，因为它有教给最低公分母的感觉，更重要的是，拒绝坚强而又有上进心的学生，他们想通过真正了解重要概念的工作原理（不仅是抽样分布！）来学习更多有关统计应用的知识。）。另一方面，中位学生似乎确实掌握了例如p值，因此也许他们根本不需要了解采样分布。

问题

您采用什么策略教授抽样分布？我知道有可用的材料和讨论（例如，这里和这里以及打开PDF文件的本文），但我只是想知道我是否可以得到一些对人有用的具体示例（或者我猜什至什么都不有用）因此我不会尝试！）。现在，正如我计划9月份的课程那样，我现在的计划是遵循Gelman的建议并“强调”采样分布。我会教书，但我会向学生保证，这只是一种仅供参考的主题，不会出现在考试中（除非作为奖励问题？！）。但是，我真的很想听听人们使用的其他方法。

distributions sampling teaching

— 斯米里格
source

您也可以使用非正态总体分布来显示中心极限定理

— user41270 2014年

抱歉，这应该是我在下面的回答中的评论。

— 2014年

23

我认为，抽样分布是统计101的关键思想。您最好跳过该过程，也可以跳过该问题。但是，我很熟悉这样一个事实：无论您做什么工作，学生都不知道。我有一系列的策略。这些可能会花费很多时间，但是我建议跳过/缩写其他主题，以确保他们了解采样分布的想法。这里有一些提示：

清楚地说：我首先明确提到我们关注的3种不同分布：总体分布，样本分布和抽样分布。在整个课程中，我会一遍又一遍地讲，然后在整个课程中一遍又一遍地讲。每次我说的这些方面，我强调与众不同的结局：SAM- PLE，samp- 玲。（是的，学生确实对此感到厌倦；他们也得到了这个概念。）
使用图片（图）： 每次我谈论这个时，我都会使用一组标准图。它具有三个分布图，分别显示清晰且通常带有标签。（此图附带的标签在幻灯片的幻灯片上，并包含简短的说明，因此此处未显示，但显然是这样：首先是总体，然后是样本，然后是抽样分布。）
给学生们一些活动： 第一次引入这个概念时，要么带一圈划痕（有些刻痕可能消失），要么一束6面的骰子。让学生分成小组，并生成一组10个值并将其取平均值。然后，您可以在板上或使用Excel制作直方图。
使用动画（模拟）： 我在R中编写了一些（通常效率低下）代码来生成数据并在操作中显示出来。当您过渡到解释中心极限定理时，此部分特别有用。（注意Sys.sleep()声明，这些停顿让我有时间解释每个阶段的情况。）

N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)

在整个学期重新实例化这些概念： 每当我们谈论下一个主题时，我都会再次提出采样分布的想法（尽管通常只是非常简短）。最重要的地方是您教ANOVA时，因为原假设情况确实存在您从同一总体分布中多次采样的情况，而您的组均值实际上是一个经验采样分布。（有关此示例，请在此处查看我的答案：标准错误如何起作用？。）

— gung-恢复莫妮卡
source

1

这是一个很好的答案（+1）。我特别认为这些活动和模拟对于教授该主题非常有用。在入门课程中，我教了几次我们使用的Web小程序，该程序允许学生直观地了解如何从样本中计算出统计量，以及当您重复多次时，抽样分布的直方图如何开始成形。我认为这项活动对了解采样分布的帮助远超过我对学生所说的任何事情：）

— Macro

+1感谢Gung，这是一个很好的答案！也感谢您“向我发送编码”（nb。Mac用户替换windows(...)为quartz(...)）。您在整个学期强化概念的观点特别有帮助。我认为遵循这些准则确实很有用。

— smillig

（+1）表示“ 3-distributions”的口头禅，以及表示关系图。在没有先了解它确实是一个独特的概念之前，没有人能理解一个概念。

— Alecos Papadopoulos 2014年

我发现赖斯大学的抽样分配页面上的“ 在线统计资料 ”页面对此非常有帮助。最初的版本已有多年历史，具有Java小程序，但我很高兴他们最近使用Javascript对其进行了重新制作。它的工作方式与图表基本相同。

— 银鱼

8

我很幸运地提醒学生，抽样分布是基于随机样本的检验统计量的分布。我让学生们认为采样过程本身会产生偏差，重点放在极端案例上。例如，如果我们的采样过程始终选择相同的（特殊）子集，那么“采样分布”将是什么样子。然后，如果我们的采样过程只选择了两个特定的（特殊）子集（每个子集的概率为1/2），我将考虑“采样分布”的样子。使用样本均值（特别是针对特定人群的“特殊”选择）可以很容易地得出这些平均值。

我认为对于某些（显然不是全部）学生，这似乎有助于他们理解抽样分布可能与人口分布大不相同。我还使用了迈克尔·切尔尼克（Michael Chernick）提到的中心极限定理的例子，并取得了一些成功-尤其是在分布显然不正常的情况下（模拟似乎确实有帮助）。

— 寿田
source

格雷厄姆·库克森（Graham Cookson）在课堂上做了一个很好的练习，答案是“您最喜欢外行人对一个困难的统计概念的解释是什么？”。-社区Wiki。

— shoda 2012年

+1，谈论非随机样本的采样分布将是一个好主意。

— gung-恢复莫妮卡

+1关于子集选择的好主意！我认为这是您所指的@shoda链接：stats.stackexchange.com/a/554/9249

— smillig

7

我从概率的教学开始。我没有涉及很多正式的定义和规则（只是时间不够），而是通过模拟来显示概率。蒙蒂·霍尔（Monty Hall）问题是一个很好的例子，我通过仿真（然后跟进逻辑）证明，切换策略可以提高获胜的可能性。我指出，通过仿真，我们能够多次玩游戏（没有风险或回报）来评估策略，这使我们可以选择更好的策略（如果我们处于那种情况下）。选择更好的策略并不能保证成功，但它给我们带来了更好的机会，并有助于在策略之间做出选择。然后，我指出这将如何应用于本课程的其余部分，它将帮助我们选择存在随机成分的策略，

然后，当我介绍采样分布时，我再次从仿真开始，说我们要制定策略。就像蒙蒂·霍尔（Monty Hall）问题一样，在现实生活中，我们只能采样1个样本，但是我们可以模拟大量样本来帮助我们制定策略。然后，我显示了来自相同总体（在这种情况下为已知总体）的许多样本的模拟，并显示了我们从模拟中学习的关系（样本均值的直方图），即样本均值围绕真实均值聚类（均值均值是均值），较大样本的样本分布标准偏差较小，较大样本的样本分布更标准。我一直在谈论重复模拟的想法以选择策略，就像现在将Monty Hall问题应用于样本均值而不是游戏展示一样。然后，我展示正式规则，并说除了模拟之外，还可以通过数学方式对其进行证明，但我不会在整个课堂上使用这些证明。我提供的是，如果他们真的想看数学证明，他们可以上班时间给我看，然后给他们看一下数学知识（入门班中的任何人都没有考虑过这一点）。

然后，当我们进行推理时，我说我们只能在现实世界中采样1个样本，就像我们最多只能玩1次游戏一样，但是我们可以使用从模拟中学到的策略许多样本会制定一种策略（z检验，t检验或CI公式），从而为我们提供所选的属性（正确的机会）。就像在游戏中一样，我们在开始之前不知道最终结论是否正确（通常我们以后仍然不知道），但是我们确实从模拟和采样分布中知道了长期概率正在使用什么该策略。

100％的学生是否完全理解？不，但是我想他们中的更多人得到了我们可以使用模拟和数学规则的普遍想法（他们很高兴他们不必看书，只是相信这本书/教师）选择了具有以下特征的策略/公式：所需的属性。

— 格雷格·雪诺
source

+1感谢您分享此建议。我认为您将问题固定在了一个问题上，那就是我们可以教的有关采样分布的知识与如何将其推断出单个样本的推断之间的联系。正如您（和这里的其他人）所建议的那样，在整个课程中不断重申这一概念很重要，但并不经常这样做（至少不是我本人这样做，可能是因为我已经很难适应我想要的一切，更不用说回到已经涵盖的概念了！）。

— smillig

3

对您而言，这是一个非常重要且经过深思熟虑的问题。我确实认为，采样分布的概念对于理解推论是不同的，因此绝对应该加以教导。

我教过许多入门统计学课程，尤其是生物统计学。我讲授抽样分布的概念，并拥有一些我认为不错的方法，但实际上并没有很好的反馈来确定我在这些方法上的成功程度。无论如何，这就是我的工作。

首先，我尝试给出一个简单的定义。抽样分布是如果抽样过程重复多次，则测试统计量应具有的分布。取决于要从中生成数据的总体分布。

尽管我认为这只是一个简单的定义，但我意识到这不是很简单，并且在大多数情况下不会立即理解该概念。因此，紧随其后的是一个基本示例，该示例增强了定义中所说的内容。

我将使用的示例是大小为n的样本，该样本是独立的并且作为均值μ和方差σ正态分布均等地分布，然后将样本均值用作均值的点估计或用于形成检验统计量对于均值，具有均值μ和方差σ / n的正态采样分布。 $^2$ $^2$

然后，我将继续讨论一个重要的应用，即中心极限定理。用最简单的术语来说，中心极限定理说，对于许多非正态分布，当样本大小n大时，样本均值的采样分布将接近于正态分布。为了说明这一点，采用均匀分布这样的分布（双峰分布也比较好看），并显示样本量为3、4、5、10和100时均值的采样分布是什么样。学生可以看到分布的形状从小n看起来根本不是正态的东西变为大n看起来非常像正态分布的东西。

为了使学生相信这些采样分布确实具有这些形状，让学生进行模拟以生成许多大小不同的样本并计算样本均值。然后让他们为这些平均值估计生成直方图。我还建议进行物理演示，以显示使用梅花形板如何工作。在执行此操作时，您要指出该设备如何生成独立的伯努利试验总和的样本，其中每个级别向左或向右移动的概率等于1/2。底部的结果堆栈表示此采样分布的直方图（二项式），并且在将大量的球落在梅花形的底部之后，可以看到其形状看起来近似于法线，

— 迈克尔·R·切尼克
source

感谢您的宝贵建议。我真的很喜欢实际的物理演示的想法，并且一定会尝试执行类似的操作（假设我可以将他们从Facebook上分散足够长的时间...），尽管与独立的伯努利试验总和之间的联系可能有点超出他们的预期。头！谢谢。

— smillig

1

但是从实验中看到正态分布形状确实让人大开眼界。当我还是个孩子（大约10岁）时，我第一次在芝加哥科学博物馆看到了其中的一个例子。那时对统计信息一无所知，但从未忘记曲线。

— 2012年

1

我认为最好将数字“包”放入袋子中（例如1-10）。您可以自己制作瓷砖，也可以使用硬币，扑克牌等。

让学生分组（5人或以上）参加，每个人从书包中挑选一个号码。然后，每组计算其组的平均值。告诉他们，您较早时已计算出总体均值，将其绘制在直方图上，然后让每个组的成员出现，并将其样本均值绘制在围绕此的直方图上。让他们几次练习以“建立直方图”。

然后，您将能够以图形方式显示总体均值周围样本均值的变化。计算出样本均值与总体均值之间的差异。我认为学生会清楚地记得进行这样的实践练习，因此，样本变化的概念会更容易地回到他们身上。这听起来似乎有点幼稚，但学生有时就像是要做出一些积极的改变。...在统计数据中，这样做的机会并不多。

— 用户名
source