题
负二项式(NB)分布的方差始终大于其均值。当样本均值大于其方差时,尝试以最大似然或矩估计拟合NB的参数将失败(没有有限参数的解决方案)。
但是,从NB分布获取的样本的平均值可能大于方差。这是R中的可复制示例。
set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576
NB将产生无法估计参数的样本的可能性为非零(通过最大似然法和矩量法)。
- 可以对此样本给出合理的估计吗?
- 当没有为所有样本定义估计量时,估计理论怎么说?
关于答案
@MarkRobinson和@Yves的答案使我意识到参数化是主要问题。NB的概率密度通常写为
在第一个参数化下,每当样本的方差小于均值时,最大似然估计为,因此关于p不能说有用。根据第二,它是(∞ ,ˉ X),所以我们可以给的合理估计米。最后,@ MarkRobinson表明我们可以使用r解决无限值问题代替r。
总之,这个估计问题从根本上没有错,只是您不能总是对每个样本给出和p的有意义的解释。公平地说,这两个答案中都包含了这些想法。我选择@MarkRobinson中的那个作为他给出的补码的正确选择。