我想知道关于人口平均值如果我只有一个测量值(样本大小为1),我们能说什么呢?显然,我们希望有更多的测量结果,但无法获得。
在我看来,由于样本均值等于,因此。但是,如果样本大小为1,则样本方差是不确定的,因此我们对使用作为的估计量的信心也是不确定的,对吗?有没有办法完全限制我们对的估计?
我想知道关于人口平均值如果我只有一个测量值(样本大小为1),我们能说什么呢?显然,我们希望有更多的测量结果,但无法获得。
在我看来,由于样本均值等于,因此。但是,如果样本大小为1,则样本方差是不确定的,因此我们对使用作为的估计量的信心也是不确定的,对吗?有没有办法完全限制我们对的估计?
Answers:
这是一篇有关泊松案例的全新文章,采用了一种很好的教学方法:
安德森 PerGösta(2015年)。使用一个观测值构造Poisson均值的近似置信区间的一种课堂方法。美国统计学家,69(3),160-164,DOI:10.1080 / 00031305.2015.1056830。
如果已知总体正常,则给出基于单个观察值的95%置信区间X ± 9.68 | x |
这在Wall,Boen和Tweedie撰写的文章“有效的置信区间,均值为1和2的样本的有效置信区间”中进行了讨论,美国统计师,2001年5月,第一卷。55号2号。(pdf)
当然可以。使用贝叶斯范式。您可能至少对可能是什么有所了解-例如,它在物理上不能为负,或者显然不能大于100(也许您正在测量本地高中足球队成员的身高)英尺)。在此之前放一个先验,用您的单独观察更新它,您将拥有一个美妙的后验。
一个小的模拟练习,以说明@soakley的答案是否有效:
# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
# Control the random number generation so that the experiment is replicable
set.seed(i)
# Generate one draw of a normal random variable with a given mean and standard deviation
x=rnorm(n=1,mean=mu[i],sd=sd[i])
# Estimate the lower confidence bound for the population mean
lower=x-9.68*abs(x)
# Estimate the upper confidence bound for the population mean
upper=x+9.68*abs(x)
# If the true mean is within the confidence interval, count it in
if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1
在一百万次随机试验中,置信区间包括一百万次的真实均值,即总是。如果置信区间是95%的置信区间,则不应发生这种情况。
因此,该公式似乎不起作用...还是我犯了编码错误?
编辑:使用时,具有相同的经验结果;
但是,对于,它是因此非常接近95%的置信区间。
sim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
sim(0.1)
参见Edelman,D(1990)“基于一个样本量的未知单峰分布中心的置信区间”,《美国统计学家》,第44卷,第4期。文章涵盖了正态和非参数情况。