Answers:
我最喜欢CLT的是那些不适用的情况-这使我希望生活能像高斯曲线所暗示的那样有趣。因此,请向他显示柯西分布。
通常,当数学家谈论概率时,他们从已知的概率分布开始,然后谈论事件的概率。中心极限定理的真实值是,在我们不知道真实分布的情况下,它允许我们使用正态分布作为近似值。您可以问父亲一个标准的统计问题(但用数学来表述),如果数据来自具有均值mu和sd sigma的分布,则样本均值大于给定值的概率是多少,然后查看是否他假设有一个分布(然后您说我们不知道),或者说他需要知道分布。然后,您可以证明我们可以在许多情况下使用CLT来近似答案。
为了将数学与统计进行比较,我喜欢使用积分的平均值定理(这表示对于从a到b的积分,存在一个从a到b的矩形,其面积相同,矩形的高度是该矩形的平均值。曲线)。数学家看这个定理说:“很酷,我可以使用积分来计算平均值”,而统计学家看同样的定理,说“很酷,我可以使用平均值来计算积分”。
实际上,我的办公室中有均值定理和CLT(以及贝叶斯定理)的十字绣壁挂。
我想通过“课堂”练习来演示抽样变异以及本质上是中心极限定理。每班有100名学生,他们的年龄都写在纸上。在计算出平均值之后,所有纸张均具有相同的尺寸并以相同的方式折叠。这是人口,我计算了平均年龄。然后,每个学生随机选择10张纸,写下年龄并将其放回书包。(S)他计算平均值,然后将书包传递给下一个学生。最终,我们有10个学生的100个样本,每个样本估计人口均值,我们可以通过直方图和一些描述性统计量来描述。
然后,我们这次使用一组100个“意见”重复演示,这些意见重复了最近民意测验中的某些“是/否”问题,例如,如果明天召开(英国大选)选举,您会考虑投票支持英国国民党。学生们从这些意见中抽取10个。
最后,我们用连续数据和二进制数据演示了采样变化,中心极限定理等。
试着使用以下代码,更改其值M
并选择除制服以外的分布可能是一个有趣的例子。
N <- 10000
M <- 5
meanvals <- replicate(N, expr = {mean(runif(M,min=0, max=1))})
hist(meanvals, breaks=50, prob=TRUE)
如果使用Stata,则可以使用-clt-命令创建采样分布图,请参见