Answers:
样本数量并不太取决于人口数量,这与许多人的直觉相反。
大多数投票公司在样本中使用400或1000人。
有一个原因:
400的样本量将使您的置信区间为+/- 5%+/- 20(95%)中的19倍
1000的样本量将使您的+/- 3%的置信区间为20(95%)中的19倍
无论如何,当您测量比例接近50%时。
这个计算器还不错:
作为粗略的概括,每次采样人口中一小部分人时,所得到的答案就会与再次采样相同人数(但可能是不同人)时得到的答案不同。
因此,如果您想了解澳大利亚有多少人> = 30岁,并且真实的分数(上帝告诉我们)恰好恰好是0.4,而如果我们问100个人,我们可以期望的平均人数是假设它们> = 30是100 x 0.4 = 40,并且该数字的标准偏差是+/- sqrt(100 * 0.4 * 0.6)= sqrt(24)〜4.9或4.9%(二项式分布)。
由于该平方根位于其中,因此当样本量增加100倍时,标准偏差将减少10倍。因此,总的来说,要将此类测量的不确定性降低10倍,您需要采样的人数是100倍。因此,如果您要求100 x 100 = 10000人,则标准偏差将上升到49,或者下降到0.49%(以百分比为单位)。