我的问题来自阅读Minka的“估计Dirichlet分布”,该陈述在根据随机向量的观察推导Dirichlet分布的最大似然估计的情况下,没有证明以下内容:
与指数族一样,当梯度为零时,期望的足够统计量等于观察到的足够统计量。
我没有看到以这种方式呈现的指数族中的最大似然估计,也没有在搜索中找到任何合适的解释。有人可以提供对观察到的和预期的足够统计量之间的关系的洞察力,也许可以通过最大程度地减少差异来帮助理解最大似然估计?
我的问题来自阅读Minka的“估计Dirichlet分布”,该陈述在根据随机向量的观察推导Dirichlet分布的最大似然估计的情况下,没有证明以下内容:
与指数族一样,当梯度为零时,期望的足够统计量等于观察到的足够统计量。
我没有看到以这种方式呈现的指数族中的最大似然估计,也没有在搜索中找到任何合适的解释。有人可以提供对观察到的和预期的足够统计量之间的关系的洞察力,也许可以通过最大程度地减少差异来帮助理解最大似然估计?
Answers:
这是关于指数族的常见主张,但在我看来,大多数时候,它的陈述方式可能会使经验不足的读者感到困惑。因为从表面上看,它可以解释为“如果我们的随机变量遵循指数族的分布,那么如果我们采样并插入到足够的统计量中,我们将获得该统计量的真实期望值 ”。如果真是这样...更多,它还没有考虑到样本的大小,这可能会导致进一步的混乱。
指数密度函数为
哪里 是足够的统计量。
由于这是一个密度,因此必须整合为一体,因此( 是...的支持 )
等式 所有人都持有 因此我们可以就此区分双方:
互换差异化和整合的顺序,我们得到
进行差异化
插入 进入 我们得到
现在我们问:的左侧 是一个实数。因此,右侧也必须是实数,而不是函数。因此,必须在特定的条件下进行评估,并且应该是“ true” ,否则在左侧,我们将没有的真实期望值 。为了强调这一点,我们通过,然后我们重写 如
现在我们转向最大似然估计。对数样本的对数似然 是
相对于 等于 我们获得了MLE
相比 与 。右侧不相等,因为我们不能说MLE估算器触及了真实价值。所以左手边也不是。但是请记住那个等式。所有人都持有 等等 也。因此,等式中的步骤。 可以考虑到 这样我们就可以写等式 对于 :
结合 ,将我们引向有效关系
which is what the assertion under examination really says: the expected value of the sufficient statistic under the MLE for the unknown parameters (in other words, the value of the first raw moment of the distribution that we will obtain if we use in place of ), equals (and it is not just approximated by) the average of the sufficient statistic as calculated from the sample .
Moreover, only if the sample size is then we could accurately say, "the expected value of the sufficient statistic under the MLE equals the sufficient statistic".