我认为,抽样分布是统计101的关键思想。您最好跳过该过程,也可以跳过该问题。但是,我很熟悉这样一个事实:无论您做什么工作,学生都不知道。我有一系列的策略。这些可能会花费很多时间,但是我建议跳过/缩写其他主题,以确保他们了解采样分布的想法。这里有一些提示:
- 清楚 地说:我首先明确提到我们关注的3种不同分布:总体分布,样本分布和抽样分布。在整个课程中,我会一遍又一遍地讲,然后在整个课程中一遍又一遍地讲。每次我说的这些方面,我强调与众不同的结局:SAM- PLE,samp- 玲。(是的,学生确实对此感到厌倦;他们也得到了这个概念。)
- 使用图片(图): 每次我谈论这个时,我都会使用一组标准图。它具有三个分布图,分别显示清晰且通常带有标签。(此图附带的标签在幻灯片的幻灯片上,并包含简短的说明,因此此处未显示,但显然是这样:首先是总体,然后是样本,然后是抽样分布。)
- 给学生们一些活动: 第一次引入这个概念时,要么带一圈划痕(有些刻痕可能消失),要么一束6面的骰子。让学生分成小组,并生成一组10个值并将其取平均值。然后,您可以在板上或使用Excel制作直方图。
- 使用动画(模拟): 我在R中编写了一些(通常效率低下)代码来生成数据并在操作中显示出来。当您过渡到解释中心极限定理时,此部分特别有用。(注意
Sys.sleep()
声明,这些停顿让我有时间解释每个阶段的情况。)
N = 10
number_of_samples = 1000
iterations = c(3, 7, number_of_samples)
breakpoints = seq(10, 91, 3)
meanVect = vector()
x = seq(10, 90)
height = 30/dnorm(50, mean=50, sd=10)
y = height*dnorm(x, mean=50, sd=10)
windows(height=7, width=5)
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))
for(i in 1:iterations[3]) {
plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")
segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")
segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")
segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")
segments(x0=50, y0=0, x1=50, y1=y[41])
segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")
segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")
segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")
abline(h=0)
if(i==1) {
Sys.sleep(2)
}
sample = rnorm(N, mean=50, sd=10)
points(x=sample, y=rep(1,N), col="green", pch="*")
if(i<=iterations[1]) {
Sys.sleep(2)
}
xhist1 = hist(sample, breaks=breakpoints, plot=F)
hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),
ylim=c(0,N), main="", xlab="", ylab="")
if(i==iterations[3]) {
abline(v=50)
}
if(i<=iterations[2]) {
Sys.sleep(2)
}
sampleMean = mean(sample)
segments(x0=sampleMean, y0=0, x1=sampleMean,
y1=max(xhist1$counts)+1, col="red", lwd=3)
if(i<=iterations[1]) {
Sys.sleep(2)
}
meanVect = c(meanVect, sampleMean)
hist(meanVect, breaks=x, axes=F, col="red", main="",
xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))
if(i<=iterations[2]) {
Sys.sleep(2)
}
}
Sys.sleep(2)
xhist2 = hist(meanVect, breaks=x, plot=F)
xMean = round(mean(meanVect), digits=3)
xSD = round(sd(meanVect), digits=3)
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),
col="yellow", lwd=2)
abline(v=50)
txt1 = paste("population mean = 50 sampling distribution mean = ",
xMean, sep="")
txt2 = paste("SD = 10 10/sqrt(", N,") = 3.162 SE = ", xSD,
sep="")
mtext(txt1, side=1, outer=T)
mtext(txt2, side=1, line=1.5, outer=T)
- 在整个学期重新实例化这些概念: 每当我们谈论下一个主题时,我都会再次提出采样分布的想法(尽管通常只是非常简短)。最重要的地方是您教ANOVA时,因为原假设情况确实存在您从同一总体分布中多次采样的情况,而您的组均值实际上是一个经验采样分布。(有关此示例,请在此处查看我的答案:标准错误如何起作用?。)