从1个样本量中我们可以说总体平均值是什么?


43

我想知道关于人口平均值如果我只有一个测量值(样本大小为1),我们能说什么呢?显然,我们希望有更多的测量结果,但无法获得。μy1

在我看来,由于样本均值等于,因此。但是,如果样本大小为1,则样本方差是不确定的,因此我们对使用作为的估计量的信心也是不确定的,对吗?有没有办法完全限制我们对的估计?y¯y1E[y¯]=E[y1]=μy¯μμ


是的,可以在某些假设下构造的置信区间。如果没有人发布,我将对其进行跟踪。μ
soakley

5
请参阅stats.stackexchange.com/questions/1807,以获取同一问题的另一个版本(样本的平均值是可用的,但没有样本量,因此,该平均值实际上是对未知样本分布的一次观察)和stats.stackexchange .com / questions / 20300进行相关讨论。
whuber

最近一篇讨论正常情况下这些估计量最优性的文章:tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305 2009年

Answers:


8

这是一篇有关泊松案例的全新文章,采用了一种很好的教学方法:

安德森 PerGösta(2015年)。使用一个观测值构造Poisson均值的近似置信区间的一种课堂方法。美国统计学家,69(3),160-164,DOI:10.1080 / 00031305.2015.1056830


不幸的是,在收费墙后面
蒂姆

@Tim:是的。再说一次,ASA的会员资格并不十分昂贵,您可以以非常合理的价格获得《美国统计学家》JASA和许多其他期刊,我个人很高兴自己掏腰包。我真的认为您在这里物有所值。YMMV,当然。
S. Kolassa-恢复莫妮卡

4
+1,但Poisson情况与正常情况完全不同,因为方差必须等于均值。泊松结果非常简单,而正常情况下的结果是违反直觉和神秘的。x±9.68|x|
变形虫说恢复莫妮卡

@amoeba:非常正确,但是OP没有对分发进行任何限制。
S. Kolassa-恢复莫妮卡

这太简短了,最好将其用作评论。但是,由于它是可接受的答案,因此您可能不希望将其转换为评论。然后,您能否总结一下本文的要点?
理查德·哈迪

42

如果已知总体正常,则给出基于单个观察值的95%置信区间X ± 9.68 | x |x

x±9.68|x|

这在Wall,Boen和Tweedie撰写的文章“有效的置信区间,均值为1和2的样本的有效置信区间”中进行了讨论美国统计师,2001年5月,第一卷。55号2号。(pdf


5
我讨厌听起来很蠢,但是..肯定不是。这取决于单位,并且根本无法正常运行(正确地说,我是指标量乘法...。)
Alec Teal 2015年

8
@Alec仅仅因为一个过程取决于度量单位(也就是说,它不是不变的)并不意味着它会自动无效甚至是错误的。这是有效的:阅读文章并做数学运算。但是,许多人会认为这有点令人不安。更令人惊讶的是,您甚至不必假设基础分布为正态分布:任何单峰分布都具有类似的结果(但必须将9.68增大到19左右):请参阅我在评论中提供的链接题。
ub

4
该期刊的下一期有三封给编辑,其中一个提到了Alec Teal关于单位的观点。Wall的回答是这样的:“置信区间不是等变的(即,其覆盖概率取决于的比率...”)说“置信区间不是基于关键量...”,这无疑是一种不同寻常的方法和结果!|μ|σ
soakley


3
当时,这似乎给出了覆盖平均值的置信区间,概率约为但可能性更高。如果则由于置信区间始终包含因此很明显概率为。σ | μ | > 0 μ = 0 100 095%σ|μ|>0μ=0100%0
亨利(Henry)

28

当然可以。使用贝叶斯范式。您可能至少对可能是什么有所了解-例如,它在物理上不能为负,或者显然不能大于100(也许您正在测量本地高中足球队成员的身高)英尺)。在此之前放一个先验,用您的单独观察更新它,您将拥有一个美妙的后验。μ


18
(+1)一个观察结果将被先验结果淹没,因此从后验中得到的结果似乎不会多于您放入先验结果中。
ub

如果我们将这样的先验与那可怜的隐含的可能性相结合,该怎么办??x±9.68|x|
Simon Kuang 2015年

@SimonKuang:一个概念性的问题是我们只能使用我们观察到之后的时间间隔,因此不能进入之前的时间x±9.68|x|x
S. Kolassa-恢复莫妮卡2015年

@StephanKolassa不,这个间隔(和相关的分布)形成可能性。我们的先决条件是分开的。
Simon Kuang

@SimonKuang:是的,你是对的,我的错。不幸的是,我目前没有时间进行处理,但是如果您这样做,请发表您发现的内容!
S. Kolassa-恢复莫妮卡2015年

14

一个小的模拟练习,以说明@soakley的答案是否有效:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

在一百万次随机试验中,置信区间包括一百万次的真实均值,即总是。如果置信区间是95%的置信区间,则不应发生这种情况。

因此,该公式似乎不起作用...还是我犯了编码错误?

编辑:使用时,具有相同的经验结果; 但是,对于,它是因此非常接近95%的置信区间。(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
确实,对于不等于0,这很有用(首先提供+1即可提供代码!)。我只是说对于,这是一个必然的结论,那就是总是会捕获0。μμ=0
Wolfgang 2015年

2
(@Wolfgang)这不是测试置信区间的方法。该定义不要求该 -电平CI涵盖了平均的时间在任何情况下:它仅要求(一)具有至少那么多覆盖在任何情况下和(b)它近似于覆盖在某些情况下。因此,为了使您的方法有效并令人信服,您将不得不搜索大量可能性。尝试α1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
ub

2
我理解您要提出的观点,但是我强烈不同意“这不是测试置信区间的方法”的说法。在CI的定义/构造中,参数是固定常数。在您的模拟中,不断变化。对于固定的,如果该方法确实给出了95%的置信区间,那么在95%的情况下它应该覆盖。没有。同样,即使使用您的构造,覆盖率也非常接近1(当然,现在我们又再次将固定为0)。μμμsim(0.1)μ
Wolfgang

2
@Wolfgang检查引用的纸张使用的定义,它是:,即为间隔至少为 0.95。μP(Xζ|X|μX+ζ|X|)1αμ
蒂姆

2
同样,是一个常数。因此,使用进行模拟是完全可以的。当然,覆盖范围必须为1。该方法提供的CI 至少具有95%的覆盖范围,并且该示例显示(无论是通过模拟还是通过推理)在某些情况下,覆盖范围可能高达100%。因此,它不是95%的CI。从很少的信息中得出某种推断仍然是一种非常聪明的方法。μ = 0μμ=0
Wolfgang

0

参见Edelman,D(1990)“基于一个样本量的未知单峰分布中心的置信区间”,《美国统计学家》,第44卷,第4期。文章涵盖了正态和非参数情况。


3
欢迎来到Stats.SE。您能否编辑您的答案以扩大它的范围,以便包括您引用的书的要点?这对于原始海报和在此站点中搜索的其他人都将更有帮助。顺便说一句,如果您还没有做的话,趁此机会参加这次巡回赛。另请参见有关如何回答格式化帮助以及使用LaTeX / MathJax写下公式的一些提示。
Ertxiem-恢复莫妮卡

欢迎来到我们的网站,大卫。非常感谢您作为该文章的作者(我相信在这里已在多个主题中被引用)做出的贡献,因此,您在此答案中可以提供的任何观点或意见将受到欢迎。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.