如何推导二项式分布的似然函数以进行参数估计?


22

根据Miller和Freund的《工程师概率与统计》,第8版(第217-218页),对于二项分布(伯努利试验),最大化的似然函数为

L(p)=i=1npxi(1p)1xi

如何得出这个方程式?对于其他分布,泊松和高斯,对我来说似乎很清楚。

L(θ)=i=1nPDF or PMF of dist.

但是二项式的只是一点点不同。坦率地说,如何

nCx px(1p)nX

成为

pxi(1个-p1个-X一世

在上述似然函数中?

Answers:


25

在最大似然估计中,您尝试使最大化;然而,最大化这等同于最大化p X1 - p ñ - X为一个固定的XnCx px(1p)nxpx(1p)nxx

实际上,高斯和泊松的可能性也不包含其前导常数,因此这种情况就像w


解决OP评论

这里有更多细节:

首先,是成功的总数,而x i是一次试验(0或1)。因此:xxi

i=1npxi(1p)1xi=p1nxi(1p)1n1xi=px(1p)nx

那显示了如何获得可能性因素(通过向后运行上述步骤)。

为什么常数消失了?非正式地,大多数人(包括我)所做的只是注意到前导常数不会影响使可能性最大化的的值,因此我们只是忽略了它(有效地将其设置为1)。p

我们可以通过获取似然函数的对数并找到其导数为零的位置来得出该值:

ln(nCx px(1p)nx)=ln(nCx)+xln(p)+(nx)ln(1p)

取导数wrt 并设置为0p0

ddpln(nCx)+xln(p)+(nx)ln(1p)=xpnx1p=0

nx=1pp=xn

注意,前导常数退出了MLE的计算。

L1,L2L1=kL2p

在实践上,使用似然函数的推论实际上是基于似然比,而不是似然的绝对值。这是由于似然比的渐近理论(渐近卡方-受某些经常适用的规律性条件的影响)。由于Neyman-Pearson引理,似然比测试受到青睐。因此,当我们尝试检验两个简单的假设时,我们将采用该比率,而共同的领先因素将被抵消。

注意:如果您要比较两个不同的模型,例如二项式和泊松模型,则不会发生这种情况。在这种情况下,常数很重要。

在上述原因中,第一个(与找到L的最大化子无关)最直接回答您的问题。


2
nCxn

@ÉbeIsaac添加了更多详细信息

2

产品中的xi是指每个单独的试用版。对于每个单独的试验,xi可以为0或1,并且n始终等于1。因此,琐碎地,二项式系数等于1。因此,在似然乘积公式中,二项式系数的乘积将为1,因此公式中没有nCx。在逐步解决问题时意识到了这一点:)(对格式感到抱歉,还不习惯用答案中的数学表达式进行回答……还:))

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.