在稍微更一般的上下文中,是观测值的维向量(响应或因变量),是观测值的矩阵(协变量或因变量),并且的参数,即则减对数似然度为
在OP的问题中,与
YnyXn×pxθ=(β1,β2,σ)Y∼N(Xβ1,Σ(β2,σ))
l(β1,β2,σ)=12(Y−Xβ1)TΣ(β2,σ)−1(Y−Xβ1)+12log|Σ(β2,σ)|
Σ(β2,σ)Σ(β2,σ)ii=σ2g(zTiβ2)2
因此行列式变为,结果减对数似然率变为
有几种方法可以使此函数最小化(假设这三个参数与变化无关)。
σ2n∏ni=1g(zTiβ2)212σ2∑i=1n(yi−xTiβ1)2g(zTiβ2)2+nlogσ+∑i=1nlogg(zTiβ2)
- 您可以尝试通过记住的约束的标准优化算法来使函数最小化。σ>0
- 您可以通过最小化固定来计算的配置文件负对数可能性,然后将结果函数插入标准无约束优化算法中。(β1,β2)σ(β1,β2)
- 您可以在分别对三个参数进行优化之间交替进行。在优化可以通过分析来完成,在上的优化是加权最小二乘回归问题,而在上的优化等同于使用的反向链接拟合gamma广义线性模型。σβ1β2g2
最后一个建议吸引了我,因为它建立在我已经熟知的解决方案的基础上。此外,无论如何,我都会考虑进行第一次迭代。也就是说,首先使用普通最小二乘法计算的初始估计值,考虑潜在的异方差,然后对平方残差拟合gamma glm以得到的初始估计值只是为了检查更复杂的模型是否值得。然后,将异方差作为权重合并到最小二乘解中的迭代可能会在估计时有所改善。β1β2 −
关于问题的第二部分,我可能会考虑通过使用标准MLE渐近线(通过仿真检查渐近线是否有效)或通过自举来计算线性组合的置信区间。wT1β1+wT2β2
编辑:通过标准的MLE渐近性,我的意思是使用多元正态近似到带有协方差矩阵的MLE分布的反Fisher信息。根据定义,Fisher信息是的梯度的协方差矩阵。通常取决于参数。如果您可以找到此数量的解析表达式,则可以尝试插入MLE。或者,您可以通过观察到的 Fisher信息(即MLE 中的Hessian)估算Fisher信息。您感兴趣的参数是两个参数的线性组合llβ-载体,因此,从逼近MLE的多元正常的描述,你可以找到的估计分布的正常近似这里。这为您提供了近似的标准误差,并且您可以计算置信区间。在许多(数学)统计书籍中都对它进行了很好的描述,但是我可以推荐的一个合理的演示文稿是Yudi Pawitan撰写的In All Likelihood。无论如何,渐近理论的形式推导是相当复杂的,并且依赖于许多规律性条件,并且它仅给出有效的渐近分布。因此,如果有疑问,我将始终使用新模型进行一些仿真,以检查我是否可以相信实际参数和样本量的结果。如果拟合过程不太耗时,可以使用简单,非参数的引导程序从观察的数据集中采样三元组进行替换,这将是一种有用的替代方法。(yi,xi,zi)