看来结果对于参数之间的特定关系成立。
对于下面的结果,我们并没有主张完全通用,而是坚持“一对二参数”的情况。表示的隐式方程式,表示两个参数之间必须保持的关系。然后是“正确的扩展”,“两个参数”的对数似然性(不是OP计算的-我们将到达那里)g(θ0,θ1)=0
Le=L∗(θ0,θ1)+λg(θ0,θ1)
等于真实似然,因为,(是一个乘数),我们可以在区分时将这两个参数视为独立的。
Lg(θ0,θ1)=0λ
使用下标表示参数的导数(一个下标一阶导数,两个下标二阶导数),正确的扩展对数似然性的Hessian的行列式为
DH(Le)=[L∗00+λg00][L∗11+λg11]−[L∗01+λg01]2=DH(L)(1)
OP在做什么呢?
他认为错误的似然 “忽略”了两个参数之间的关系,并且没有考虑约束。然后,他继续进行区分并获得L∗(θ0,θ1)g(θ0,θ1)
DH(L∗)=L∗00L∗11−[L∗01]2(2)
显然,通常不等于。(2)(1)
但是如果 ,那么g00=g11=g00=0
(1)→DH(Le)=L∗00L∗11−[L∗01]2=DH(L∗)=DH(L)
因此,如果实际参数与冗余参数之间的关系使得链接它们的隐式函数的第二部分导数都为零,则从根本上错误的方法将最终“正确”。
对于伯努利案,我们确实有
g(θ0,θ1)=θ0+θ1−1⇒g00=g11=g01=0
附录
为了回答@Khashaa问题并在此处显示机制,我们考虑了用冗余参数指定的可能性,而且考虑了将冗余参数与真实参数链接的约束。我们使用对数似然的方法是使它们最大化-因此这里有一个约束最大化的情况。假设样本大小为:n
maxL∗n(θ0,θ1)=lnθ0∑i=1nxi+(n−∑i=1nxi)lnθ1,s.t.θ1=1−θ0
这个问题有一个Langrangean(我在上面非正式地称为“正确的扩展可能性”),
Le=lnθ0∑i=1nxi+(n−∑i=1nxi)lnθ1+λ(θ1−1+θ0)
最大的一阶条件是
∑ni=1xiθ0+λ=0,n−∑ni=1xiθ1+λ0=0
为此我们获得关系
∑ni=1xiθ0=n−∑ni=1xiθ1⇒θ1∑i=1nxi=(n−∑i=1nxi)θ0
使用以上条件有效的约束,我们获得θ1=1−θ0
(1−θ0)∑i=1nxi=(n−∑i=1nxi)θ0
⇒∑i=1nxi=nθ0⇒θ^0=1n∑i=1nxi
尽我们所能。
此外,由于约束在所有参数中都是线性的,因此其二阶导数将为零。这反映在一个事实上:在拉格朗日的一阶导数中,乘数 “独立的”,当我们采用拉格朗日的二阶导数时,它将被消除。这反过来将导致我们得到一个Hessian,其行列式将等于最初的一参数对数似然的(一维)二阶导数,同时还施加了约束条件(OP就是这样做的)。然后,在两种情况下均取期望值的负数,则不会更改此数学等价关系,我们得出的关系是“一维Fisher信息=二维Fisher信息的行列式”。现在λ假设约束在所有参数中都是线性的,则OP无需在要最大化的函数中引入乘数即可获得相同的结果(在二阶导数级),因为在二阶导数级,运算符的存在/效果在这种情况下约束消失了。
所有这些都与微积分有关,与统计概念无关。