数字20是魔法吗?


12

我的参考文献建议为数据拟合分布考虑至少20个样本。

这有什么意义吗?

谢谢


3
通常不,在特定情况下。您有参考资料,您的目标是什么?
image_doctor

1
我同意@image_doctor-没有普遍的理由将20个观测值视为最小值。在非常特殊的情况下可能会如此。
Glen_b-恢复莫妮卡

3
在某些实际情况下,例如在已知分布(确定地)为泊松且观测值很大的情况下,可以使用单个值。这不仅可以使分布拟合,还可以评估其参数估计中可能存在的误差。
whuber

1
我相信我也已经读过,对于正态分布,经验法则是30。在我看来,这与30度自由度的学生t与法线有多接近有关。但这只是一个经验法则。与的值相同,这不是魔术。e
韦恩

1
是的,20是个魔术数字:en.wikipedia.org/wiki/Magic_number_%28physics%29
2013年

Answers:


13

这很大程度上取决于预期的分布以及您的研究问题。作为经验法则,应该警惕经验法则。如果您知道预期的分布,请运行一些不同大小的模拟,并确定样本模拟反映实际分布的频率。这应该为最终所需的样本量提供一些指导。


+1可避免极端和教条式的陈述。
whuber

1
+1的部分原因是“根据经验,您应该警惕经验法则。”
沃尔夫冈

7

我以为样本数量的魔数是1,000。这就是大多数美国国家调查所产生的误差幅度,约为3%: 实际上,有效样本数要低超过1,000个,更喜欢700个左右,这是由于选择的可能性不平等以及无响应调整所致,导致了3.7%的误差范围。

z0.9750.50.5/1000=1.960.158=0.031

仅用20个观测值,从技术上讲,您不会获得很高的偏度和峰度值(当然,要通过样本标准偏差归一化):

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.
如果您采用矩量法拟合分布,则显然无法拟合为对数正态分布,其对数的合理典型方差等于1(中高收入不平等国家/地区的收入分布;美国,巴西,南非,俄罗斯的对数收入方差都较大,因为其峰度惊人地大,为111。用矩量法拟合对数正态分布当然很愚蠢,但我只是想表明一些现实世界的分布会可能比20个观察结果所描述的更为复杂。

关于分布拟合的另一种观点可以通过核密度估计得出:对于大小为的样本,最流行的规则给出的带宽为 使用高斯核有效地覆盖了整个分布。换句话说,如果您对每个大小为20的样本进行内核密度估计,则大多数样本看起来都是正常的,除非它们明显具有明显的峰度(这将意味着有些偏僻的观察结果将以单独的颠簸形式出现在内核密度上)情节)。n=20

h=1.06σ^n1/5=0.58σ^

我不关注样本时间限制的相关性。当然,您可以在样本中获得极高的偏度和峰度估计值。尝试一下:当是样本均值而是样本SD时,则以对数正态分布匹配矩时的估计偏斜度为。从具有较大几何SD的分布中生成个样本(将工作),您将获得大量的偏度估计。那么,如果原始样本偏度很小,该怎么办?小号小号/3 + 小号/220 2ms(s/m)(3+(s/m)2)202
whuber

1
在使用1000作为样本量的情况下(在与编程有关的统计数据中,但在其他地方适用),必须链接到“ 十进制综合症”
。 Weaver

1
@whuber,您太聪明了,没有冒犯。大多数人会把偏斜度当作数据的时刻来计算,而不是像您刚才那样通过参数假设进行计算。现在,如果我说“假设您通过矩量法拟合皮尔逊分布”,那么该论点是否有意义?
StasK 2013年

是的,这在许多情况下都是有意义的。我按照您的建议使用矩量法拟合对数正态分布,并获得了较大的偏斜度,这不足为奇。这是因为我只匹配前两个时刻,而让第三个时刻变为可能。如果我使用两个或更少参数的任何分布族遵循相同的过程,并且允许任意大的第三矩,那么我想我会看到相同的现象。对于具有两个以上参数的Pearson系列,我们可能会尝试匹配经验偏度,从而限制其值。
whuber

2

不。不是遥远的。

像这样思考:如果您拥有一个十亿维的空间(人类),并且使用任何方法(20个人)抽取了20个样本,您能否利用所获得的信息来合理地理解地球上的每个人?不是遥远的。银河系中有1000亿颗恒星。通过随机选择20个,您可以了解所有的银河系天文学吗?没门。

在一维空间中,有些启发式方法(主要是有效的经验法则)可以提供帮助,它们描述了您要进行的测量次数。它们包括不同程度的效用和辩护,但在某种意义上说比“ 20”更具辩护性。它们包括“拟合方程中每个变量5次测量”,“至少35个高斯密度函数样本”和“至少300个二项式函数样本”。真正的统计学家,而不是像我这样的书呆子炸弹人,将能够在没有计算器的情况下将特定的置信区间和不确定性与第一性原理相关联。

如果您使用“拟合方程中每个参数进行5次测量”的规则,并且要根据高度分布拟合2维弯曲的双三次曲面的累积密度,则您的基础系统将是,是五阶多项式与三次方的比率。它将具有6 + 4 = 10个系数。如果尝试使用每个参数2个测量值或使用20个测量值来拟合10个参数值,则将违反此启发式方法。此试探法建议至少进行10 * 5 = 50次测量。a3r3+a2r2+a1r+a0a1r+a0dr

请记住,“最佳”是没有意义的想法,而没有“善意的衡量”。最佳途径是什么?如果您要灭顶之灾,也许是一个漫长而令人愉快的旅程。如果您要参加自己的加冕典礼,也许简短而宏伟。如果您正在沙漠中漫步,那可是阴凉的地方。“最佳”样本数量是多少?它是如此惊人地取决于您的问题,因此在此之前无法开始获得权威的答复。他们都?尽可能多吗?这些只是一点道理。是的,这就像部分死亡或怀孕。部分荒谬是一个非常不确定的问题的结果。

如果您想准确预测飞机上的气流?您可能需要进行数百万次测量才能进入球场。如果您想知道自己的身高,可以做一两个。

这并没有提出“跨越空间”和“在参数估计值差异最小的位置进行采样”的要点,但是该问题表明,更新生的答案是有意义的。这些事情需要在实施之前更多地了解问题的性质。

注意:根据建议进行了修改以改进。


1
您似乎已在问题中将“最小”读为“最大”或“足够”。您所写的任何内容似乎都与20分以上的经验法则没有矛盾。
whuber

2
@whuber,我与那些认为额外的测量非常昂贵的人们一起工作,如果我向他们提供“最少数量的样本”,他们不会认为潜在的样本数量大于该数量的不平等。他们将其视为最小化成本的优化问题的边界,并尝试仅以此值进行操作。这是我的环境的产物。
EngrStudent 2013年

1

也许是在进行t检验或ANOVAR的情况下-在基本统计应用中很常见-在每个组的样本量左右,以便对每个组的均值有很大的信心正态分布(根据中心极限定理),可以认为分布或多或少是单峰的且不是非常尖峰。二十而不是十九或二十一,因为它是一个整数。


0

在Russ Lenth的功效和样本量页面上,可以找到有关该主题的一些文章(在页面中间的“建议”部分)。

样本中的最小个体数量根据人口规模,维度数(如果您将数据划分为类别)和度量(如果对样本个体进行连续度量)的不同而大不相同。您的宇宙,您打算使用的分析技术(这是非常重要的一点-技术是在研究计划或实验设计期间定义的,永远不会以后),以及以前的研究表明的复杂性。

在“稀有疾病”和“实验心理学”(波普尔在他的工作中定义的心理)学科之外的任何严肃研究中,只有20个还不够。

根据以下评论完善答案:

在涉及稀有疾病分布和适应性分布的“罕见疾病”和“实验心理学”(波普尔在他的工作中定义的心理学)的主题之外,对于任何严肃的研究而言,20都是不够的。

不,您不应该为了使样本数量过多而使人中毒。常识和顺序测试命令您停止。


3
我认为过于笼统地说一个样本20个“不足以进行任何认真的研究”。这与您先前的说法相矛盾,即适当的样本量随目的,总体等因素而变化。在某些情况下,一个虚假的结果足以杀死整个理论。
whuber

1
案例研究和定性研究对1-5名参与者可以做得很好。
Behacad

好吧,将“案例研究”和“焦点小组”添加到列表中:)这些都包含在我所说的波普尔所谓的“实验心理学”之中。
Lucas Gallindo

4
然后,您最好增加天文学,医学,生物学,化学……。换句话说,断言20是“不够”和断言它足够好一样不好。实际上,这可能更糟。想象一下一项食品安全试验,其中接受营养补充剂的前八名受试者死于意料之外的副作用。您是否会根据“ 20还不够”的说法提倡继续测试?
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.