您如何将中心极限定理的美传达给非统计学家?


Answers:


16

我最喜欢CLT的是那些不适用的情况-这使我希望生活能像高斯曲线所暗示的那样有趣。因此,请向他显示柯西分布。


柯西分布与CLT或CLT的故障之间有什么关系?
罗宾吉拉德


CLT要求MGF存在于0附近。柯西分布不具有该属性。CLT Win。Cauchy甚至不能满足更强大的CLT版本的较弱要求,在CLT中,所需要的只是存在均值和方差。柯西分布表明,要保持CLT,必须存在均值。它不会使CLT失败。
巴尔的摩

@Baltimark您误解了我的帖子-很明显,由于CLT的假设,Cachy未被CLT涵盖,否则就无法证明CLT。我举这个例子是因为人们相信CLT适用于所有发行版。“失败”可能不是一个完美的词,但我仍然认为这不是拒绝投票的原因。好的,我什至将其更改为不适用。

我喜欢您的编辑。柯西分布绝对很酷。
巴尔的摩

14

要完全理解CLT,应该看到它。

因此,bean机器的概念和大量的YouTube 视频可供说明。


我认为它显示了二项式分布;我认为它的渐近性与CLT没有直接联系。

2
豆芽机在包装动画的作者...... yihui.name/en/wp-content/uploads/2010/07/...
罗宾·吉拉德


我已经写过@robin,这是什么问题?

1
@ShreevatsaR重点是,一个好的插图应该显示某物的“核心”,并且(至少是IMO)CLT的“核心”在于将多种不同分布的变量混合成高斯的事实,而不是只是二项式分布的极限。

7

通常,当数学家谈论概率时,他们从已知的概率分布开始,然后谈论事件的概率。中心极限定理的真实值是,在我们不知道真实分布的情况下,它允许我们使用正态分布作为近似值。您可以问父亲一个标准的统计问题(但用数学来表述),如果数据来自具有均值mu和sd sigma的分布,则样本均值大于给定值的概率是多少,然后查看是否他假设有一个分布(然后您说我们不知道),或者说他需要知道分布。然后,您可以证明我们可以在许多情况下使用CLT来近似答案。

为了将数学与统计进行比较,我喜欢使用积分的平均值定理(这表示对于从a到b的积分,存在一个从a到b的矩形,其面积相同,矩形的高度是该矩形的平均值。曲线)。数学家看这个定理说:“很酷,我可以使用积分来计算平均值”,而统计学家看同样的定理,说“很酷,我可以使用平均值来计算积分”。

实际上,我的办公室中有均值定理和CLT(以及贝叶斯定理)的十字绣壁挂。


嗯 我认为大多数数学家都使用MVT将整数近似为矩形。
主教

5

我想通过“课堂”练习来演示抽样变异以及本质上是中心极限定理。每班有100名学生,他们的年龄都写在纸上。在计算出平均值之后,所有纸张均具有相同的尺寸并以相同的方式折叠。这是人口,我计算了平均年龄。然后,每个学生随机选择10张纸,写下年龄并将其放回书包。(S)他计算平均值,然后将书包传递给下一个学生。最终,我们有10个学生的100个样本,每个样本估计人口均值,我们可以通过直方图和一些描述性统计量来描述。

然后,我们这次使用一组100个“意见”重复演示,这些意见重复了最近民意测验中的某些“是/否”问题,例如,如果明天召开(英国大选)选举,您会考虑投票支持英国国民党。学生们从这些意见中抽取10个。

最后,我们用连续数据和二进制数据演示了采样变化,中心极限定理等。


4

试着使用以下代码,更改其值M并选择除制服以外的分布可能是一个有趣的例子。

N <- 10000
M <- 5
meanvals <- replicate(N, expr = {mean(runif(M,min=0, max=1))}) 
hist(meanvals, breaks=50, prob=TRUE) 


2

以我的经验,CLT没有看起来有用。在项目的中间,人们永远不知道n是否足够大,足以使近似值足以完成任务。对于统计测试,CLT可以帮助您保护I型错误,但对于阻止II型错误几乎没有帮助。例如,当数据分布极端偏斜时,t检验对于大n可以具有任意低的功率。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.