为什么算术平均值小于对数正态分布中的分布平均值?


13

所以,我有一个随机过程生成数正态分布随机变量X。这是相应的概率密度函数:

该图表示对数正态概率密度函数

我想估计分配是原始分配的几个时刻,让我们说第一次的时刻:算术平均值。为此,我绘制了100个随机变量10000次,以便可以计算10000次算术平均值估计。

有两种不同的方法可以估算均值(至少,这是我的理解:我可能是错的):

  1. 通过清楚地计算的算术平均值以通常的方式:
    X¯=i=1NXiN.
  2. 或先根据基本正态分布估算μμ = N i = 1 log X iσμ然后平均值作为 ˉ X =EXPμ+1
    μ=i=1Nlog(Xi)Nσ2=i=1N(log(Xi)μ)2N
    X¯=exp(μ+12σ2).

问题在于,与每个这些估计相对应的分布在系统上是不同的:

如图所示,两个估算器给出了不同的分布。

“普通”平均值(用红色虚线表示)提供的值通常比从指数形式(绿色纯线)得出的值低。尽管这两个均值都是在完全相同的数据集上计算得出的。请注意,这种差异是系统性的。

为什么这些分布不相等?


σ的真实参数是多少?μσ
Christoph Hanck

σ = 1.5,但请注意,我有兴趣估算这些参数,因此采用蒙特卡洛方法,而不是根据这些原始数字计算事物。μ=3σ=1.5
JohnW

当然,这是为了复制您的结果。
Christoph Hanck

4
xiyixi/nexp(yi/n)exp(sy2/2)sy2yi。因此,对于任何父级分布(描述正随机数),红色虚线曲线必须位于绿色实线的左侧。
豪伯

如果大部分均值来自极小的概率,那么有限的样本算术平均数可能会低估总体均值。(在期待它的公正,但有一个小的低估和大高估小概率的概率大。)这个问题还可能涉及到这一个:stats.stackexchange.com/questions/214733/...
马修·甘恩

Answers:


12

Nexp[μ+1/2σ2]

X¯pE(Xi)

exp[μ^+1/2σ^2]pexp[μ+1/2σ2],
μ^pμσ^2pσ2

但是,MLE并非一帆风顺。

Nμ^σ^2N=100N1μσ2

E(μ^+1/2σ^2)μ+1/2σ2

E[exp(μ^+1/2σ^2)]>exp[E(μ^+1/2σ^2)]exp[μ+1/2σ2]

N=100

N=1000

在此处输入图片说明

创建于:

N <- 1000
reps <- 10000

mu <- 3
sigma <- 1.5
mm <- mle <- rep(NA,reps)

for (i in 1:reps){
  X <- rlnorm(N, meanlog = mu, sdlog = sigma)
  mm[i] <- mean(X)

  normmean <- mean(log(X))
  normvar <- (N-1)/N*var(log(X))
  mle[i] <- exp(normmean+normvar/2)
}
plot(density(mm),col="green",lwd=2)
truemean <- exp(mu+1/2*sigma^2)
abline(v=truemean,lty=2)
lines(density(mle),col="red",lwd=2,lty=2)

> truemean
[1] 61.86781

> mean(mm)
[1] 61.97504

> mean(mle)
[1] 61.98256

exp(μ+σ2/2)

Vt=(σ2+σ4/2)exp{2(μ+12σ2)},
exp{2(μ+12σ2)}(exp{σ2}1)
exp{σ2}>1+σ2+σ4/2,
exp(x)=i=0xi/i!σ2>0

NN <- c(50,100,200,500,1000,2000,3000,5000)

在此处输入图片说明

NNN=50

> tail(sort(mm))
[1] 336.7619 356.6176 369.3869 385.8879 413.1249 784.6867
> tail(sort(mle))
[1] 187.7215 205.1379 216.0167 222.8078 229.6142 259.8727 

N

1
N=100N

2
好吧,我也很惊讶这两种方法之间的差异如此之大,但是这个例子绝对完美地说明了为什么“仅仅对东西求平均”会很糟糕!
JohnW

1
@JohnW,我添加了一些分析性解释,说明了为什么MLE的方差较小。
Christoph Hanck

1
NN
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.