相关系数的估计量(在双变量标准正态下等于协方差)
r~=1n∑i=1nxiyi
是矩量估计器,样本协方差。让我们来看看它的最大似然估计一致ρ。ρ^
具有相关系数的双变量标准法线的联合密度 为ρ
f(x,y)=12π1−ρ2−−−−−√exp{−x2+y2−2ρxy2(1−ρ2)}
因此,大小为的iid样本的对数似然为n
lnL=−nln(2π)−n2ln(1−ρ2)−12(1−ρ2)∑i=1n(x2i+y2i−2ρxiyi)
(这里的iid假设当然是针对二维人口的每次抽签)
取关于的导数并将其设置为零,可得出ρ中的3d度多项式:ρρ
ρ^:nρ^3−(∑i=1nxiyi)ρ^2−(1−1n∑i=1n(x2i+y2i))nρ^−∑i=1nxiyi=0
如果取取以真实系数估算的导数的期望值,则可以验证计算正确,它将等于零。ρ
为了紧凑起见,写,它是X和Y的样本方差之和。如果将一阶导数除以n,MoM估计量将出现(1/n)∑ni=1(x2i+y2i)=(1/n)S2XYn
ρ^:ρ^3−r~ρ^2+[(1/n)S2−1]ρ^−r~=0
⇒ρ^(ρ^2−r~ρ^+[(1/n)S2−1])=r~
做代数,不难得出结论,我们将获得ρ = 〜- [R ,当且仅当,(1 / Ñ )š 2 = 2,即,仅当它恰巧样本的总和等于方差的总和真正的差异。所以一般ρ^=r~(1/n)S2=2
ρ^≠r~
那么这里发生了什么?明智的人将对此进行解释,目前,让我们尝试一个模拟:我生成了两个相关系数的两个标准法线的iid样本。样本量为n = 1.000。样本值为ρ=0.6n=1.000
∑i=1nxiyi=522.05,S2=1913.28
矩量估计器为我们提供
r~=522.051000=0.522
对数似然会发生什么?在视觉上,我们有
在数字上,我们有
ρ0.50.510.520.530.540.550.560.570.580.590.61st deriv−70.92−59.41−47.7−35.78−23.64−11.291.2914.127.1540.4453.98lnL−783.65−782.47−781.48−780.68−780.1−779.75−779.64−779.81−780.27−781.05−782.18
ρ=0.56(ρ^=0.558985)ρ
因此,这模拟符合其结果是最大似然估计器不等于矩量法估计(其是两个RV的之间的样本协方差)。
但是似乎“每个人”都在说 …… 应该这样解释。
更新
证明MLE是矩量估计法的参考文献:Anderson,TW,&Olkin,I.(1985)。多元正态分布参数的最大似然估计。线性代数及其应用,70,147-171。
在这里,所有均值和方差可以自由变化而不是固定不重要吗?
...可能是的,因为@guy在另一个(现在已删除)答案中的评论说,在给定的均值和方差参数的情况下,双变量法线成为弯曲指数族的成员(因此某些结果和属性会发生变化)...这似乎是调和这两个结果的唯一方法。