“抽样理论”人士会告诉您,不存在这样的估计。但是您可以得到一个,您只需要对先验信息有一个合理的了解,并做很多困难的数学工作即可。
如果您指定了贝叶斯估计方法,并且后验与前验相同,那么您可以说数据对参数什么也没说。因为事情可能会在我们身上变得“奇异”,所以我们不能使用无限的参数空间。我假设因为您使用Pearson相关,所以您具有双变量正态似然:
Q我=(X我-μX)2
p(D|μx,μy,σx,σy,ρ)=(σxσy2π(1−ρ2)−−−−−−−−√)−Nexp(−∑iQi2(1−ρ2))
其中
Qi=(xi−μx)2σ2x+(yi−μy)2σ2y−2ρ(xi−μx)(yi−μy)σxσy
现在表明一个数据集可能是相同的值,写,然后我们得到:yi=y
小号2X=1
∑iQi=N[(y−μy)2σ2y+s2x+(x¯¯¯−μx)2σ2x−2ρ(x¯¯¯−μx)(y−μy)σxσy]
其中
s2x=1N∑i(xi−x¯¯¯)2
因此,您的可能性取决于四个数字。因此,您需要一个的估计值,因此需要乘以一个先验值,并整合出讨厌的参数。现在为集成做准备,我们“完成平方”
s2x,y,x¯¯¯,Nρμx,μy,σx,σy
∑iQi1−ρ2=N⎡⎣⎢⎢(μy−[y−(x¯¯¯−μx)ρσyσx])2σ2y(1−ρ2)+s2xσ2x(1−ρ2)+(x¯¯¯−μx)2σ2x⎤⎦⎥⎥
现在,我们应该谨慎行事,并确保正确归一化的概率。这样我们就不会遇到麻烦。一种这样的选择是使用信息量较弱的先验,这仅限制了每种方法的范围。因此对于具有平坦先验的均值,我们具有对于具有jeffreys的标准差,我们具有先验。可以通过一些“常识”问题来轻松设置这些限制。我将对使用一个未指定的,这样我们就可以了(如果没有在处截断奇点,则制服应该可以正常工作):Lμ<μx,μy<UμLσ<σx,σy<Uσρ±1
p(ρ,μx,μy,σx,σy)=p(ρ)Aσxσy
其中。这给出了以下条件:A=2(Uμ−Lμ)2[log(Uσ)−log(Lσ)]2
p(ρ|D)=∫p(ρ,μx,μy,σx,σy)p(D|μx,μy,σx,σy,ρ)dμydμxdσxdσy
=p(ρ)A[2π(1−ρ2)]N2∫UσLσ∫UσLσ(σxσy)−N−1exp(−Ns2x2σ2x(1−ρ2))×
∫UμLμexp(−N(x¯¯¯−μx)22σ2x)∫UμLμexp⎛⎝⎜⎜−N(μy−[y−(x¯¯¯−μx)ρσyσx])22σ2y(1−ρ2)⎞⎠⎟⎟dμydμxdσxdσy
现在在第一积分可以通过使变量的变化来进行和第一积分超过变为:μyz=N−−√μy−[y−(x¯¯¯−μx)ρσyσx]σy1−ρ2√⟹dz=N√σy1−ρ2√dμyμy
σy2π(1−ρ2)−−−−−−−−√N−−√⎡⎣⎢Φ⎛⎝⎜Uμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟−Φ⎛⎝⎜Lμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟⎤⎦⎥
您可以从这里看到没有解析解决方案。但是,还值得一提的是值尚未从方程式中删除。这意味着数据和先验信息仍然对真正的相关性有话要说。如果数据避谈相关性,那么我们就可以简单地留下了作为唯一的功能这些方程。ρp(ρ)ρ
它还显示了传递到到无穷大的极限是如何“丢弃”一些有关的信息的,这些信息包含在看上去很复杂的普通CDF函数。现在,如果您有大量数据,那么传递到极限就可以了,您不会丢失太多,但是,如果您有非常稀少的信息(例如您的情况),那么请务必保留所有废料。这意味着很难看的数学,但是这个例子在数字上并不难。因此,我们可以很容易地评估在值的积分似然。只需在足够小的时间间隔内用求和替换积分-这样您就可以进行三次求和μyρΦ(.)ρ−0.99,−0.98,…,0.98,0.99