所以,我有一个随机过程生成数正态分布随机变量。这是相应的概率密度函数:
我想估计分配是原始分配的几个时刻,让我们说第一次的时刻:算术平均值。为此,我绘制了100个随机变量10000次,以便可以计算10000次算术平均值估计。
有两种不同的方法可以估算均值(至少,这是我的理解:我可能是错的):
- 通过清楚地计算的算术平均值以通常的方式:
- 或先根据基本正态分布估算和μ:μ = N ∑ i = 1 log (X i)然后平均值作为 ˉ X =EXP(μ+1
问题在于,与每个这些估计相对应的分布在系统上是不同的:
“普通”平均值(用红色虚线表示)提供的值通常比从指数形式(绿色纯线)得出的值低。尽管这两个均值都是在完全相同的数据集上计算得出的。请注意,这种差异是系统性的。
为什么这些分布不相等?
和σ的真实参数是多少?
—
Christoph Hanck
且 σ = 1.5,但请注意,我有兴趣估算这些参数,因此采用蒙特卡洛方法,而不是根据这些原始数字计算事物。
—
JohnW
当然,这是为了复制您的结果。
—
Christoph Hanck
。因此,对于任何父级分布(描述正随机数),红色虚线曲线必须位于绿色实线的左侧。
—
豪伯
如果大部分均值来自极小的概率,那么有限的样本算术平均数可能会低估总体均值。(在期待它的公正,但有一个小的低估和大高估小概率的概率大。)这个问题还可能涉及到这一个:stats.stackexchange.com/questions/214733/...
—
马修·甘恩