Answers:
这可能会让很多人感到惊讶,但是要解决此问题,您不必估计s。实际上,您无需了解任何有关数据传播的信息(尽管这当然会有所帮助)。例如,Wall,Boen和Tweedie在2001年的一篇文章中描述了如何基于一次绘制为任何单峰分布的均值找到一个有限的置信区间。
在目前的情况下,我们有一定的基础将样本均值112作为近似正态分布(即49个薪水的简单随机样本的平均值的样本分布)的平局。我们隐式地假设有大量的工厂工人,并且他们的工资分配没有偏斜或多模态,以致于中央极限定理无法使用。然后,平均值的保守90%CI向上延伸至
清楚地涵盖了200的真实均值。(请参阅Wall 等人的公式3。)鉴于可用信息有限以及此处所做的假设,因此,我们不能得出结论认为112与200有“显着”差异。
参考:“有效样本数的有效置信区间,大小为1和2。” 美国统计学家,2001年5月,第1卷。55,第2号:第102-105页。(pdf)
假设ACME北部工厂有999名工人,每个工人的工资为112,而1名CEO的工资为88112。人口平均工资为。工厂的49人为(这是从超几何分布中得出的),因此,在95%的置信度下,您的总体样本均值将为112。实际上,通过调整工人/首席执行官的比例以及作为首席执行官,我们可以任意选择49名员工作为样本,而将人口平均数固定为200,将样本均值固定为112。因此,如果不对基本分布进行某些假设,就无法得出任何结论。关于总体均值的推论。