对数转换后计算标准误差


19

考虑一个正态分布的随机数字集:

x <- rnorm(n=1000, mean=10)

我们想知道平均值和平均值的标准误差,因此我们执行以下操作:

se <- function(x) { sd(x)/sqrt(length(x)) }
mean(x) # something near 10.0 units
se(x)   # something near 0.03 units

大!

但是,假设我们不一定知道我们的原始分布服从正态分布。我们对数据进行对数转换,并执行相同的标准误差计算。

z <- log(x, base=10)
mean(z) # something near 1 log units
se(z)   # something near 0.001 log units

太酷了,但是现在我们需要进行逆变换才能以非日志单位显示我们的答案。

10^mean(z) # something near 10.0 units
10^se(z)   # something near 1.00 units

我的问题:为什么对于正态分布,标准误差取决于是根据分布本身计算还是对它进行变换,计算和逆变换而有所不同?注意:无论转换如何,均值均相同。

编辑#1:最终,我对计算非正态分布数据的均值和置信区间感兴趣,因此,如果您可以就如何在转换后的数据上计算95%CI的问题提供一些指导,包括如何向后转换为其原始单位, 我会很感激!
结束编辑#1

编辑#2:我尝试使用分位数功能来获取95%的置信区间:

quantile(x, probs = c(0.05, 0.95))     # around [8.3, 11.6]
10^quantile(z, probs = c(0.05, 0.95))  # around [8.3, 11.6]

因此,这收敛于相同的答案,这很好。但是,使用这种方法无法使用样本量较小的非正常数据提供完全相同的间隔:

t <- rlnorm(10)
mean(t)                            # around 1.46 units
10^mean(log(t, base=10))           # around 0.92 units
quantile(t, probs = c(0.05, 0.95))                     # around [0.211, 4.79]
10^(quantile(log(t, base=10), probs = c(0.05, 0.95)))  # around [0.209, 4.28]

哪种方法将被视为“更正确”。我认为有人会选择最保守的估计吗?

例如,您是否将非正常数据(t)的结果报告为均值为0.92单位,且95%置信区间为[0.211,4.79]?
结束编辑#2

谢谢你的时间!


1
SE是SD除以N.不只是N的平方根
Penguin_Knight

3
谢谢!我解决了这个问题。我遇到的问题仍然存在。
2014年

Answers:


12

esd(log(Y))sd(Y)

sd(Y)sd(log(Y))

Var(g(X))(g(μX))2σX2.

Xg(X)=exp(X)

Var(exp(X))exp(μX)2σX2

sd(exp(X))exp(μX)σX

这些概念贯穿于抽样分布。

如果您的示例中的标准偏差与平均值相比确实很小,这通常会很好地工作。

> mean(y)
[1] 10
> sd(y)
[1] 0.03
> lm=mean(log(y))
> ls=sd(log(y))
> exp(lm)*ls
[1] 0.0300104 

如果要转换参数的CI ,则可以通过转换端点来工作。

E(exp(X))exp(μX)(1+σX2/2)C经验值大号C经验值ü大号üC1个+σX2/2

如果您的数据在对数刻度上大致正常,则可能需要将其视为产生对数均值间隔的问题。


1
谢谢Glen_b。我在统计课上从未学过。
2014年

2
Ë[FX]FμX+FμX2σX2=经验值μX1个+σX22
经验值μXσX2Ë[经验值X]

谢谢@Dezmond。对,那是正确的。我将对我的答案进行更正,其中接近结尾的那部分相当混乱。
Glen_b-恢复莫妮卡

0

听起来您像是有效地想要几何标准误差,类似于几何平均值 exp(mean(log(x)))

虽然将其计算为:

exp(sd(log(x)/sqrt(n-1)))

您和其他人已经指出,由于某些原因,这是不正确的。而是使用:

exp(mean(log(x))) * (sd(log(x))/sqrt(n-1))

几何平均值乘以对数标准误差。这应该很好地近似“自然”标准误差。

资料来源:https : //www.jstor.org/stable/pdf/2235723.pdf

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.