假设我有一个黑盒子,它按照均值m和标准差s的正态分布生成数据。但是,假设每当输出值<0时,它都不会记录任何内容(甚至无法说出它已经输出了这样的值)。我们有一个截断的高斯分布,没有峰值。
如何估算这些参数?
假设我有一个黑盒子,它按照均值m和标准差s的正态分布生成数据。但是,假设每当输出值<0时,它都不会记录任何内容(甚至无法说出它已经输出了这样的值)。我们有一个截断的高斯分布,没有峰值。
如何估算这些参数?
Answers:
您的数据模型为:
因此,密度函数为:
哪里,
是标准普通cdf。
然后,您可以使用最大似然法或贝叶斯方法估计参数和σ。
正如Srikant Vadali所建议的那样,Cohen和Hald在1950年左右使用ML(使用Newton-Raphson根查找器)解决了这个问题。另一篇论文是Max Halperin的“截断正态分布中的估计”(适用于可访问者)。谷歌搜索“截断的高斯估计”会产生很多有用的命中。
在将这个问题概括化的线程中提供了详细信息(通常到截断的分布)。请参见截断分布的最大似然估计。比较最大似然估计量与R中的最大熵解算器给出的(具有代码)最大熵解可能也很有趣。