Answers:
您无法比较这两个模型,因为它们没有对同一变量建模(因为您正确地认识了自己)。不过,在比较嵌套模型和非嵌套模型时,AIC都应该起作用。
在继续之前提醒您:高斯对数似然由
是模型的协方差结构,数据集中的点数,平均响应和因变量。μ X
更具体地说,AIC等于,其中是模型中固定效应的数量,似然函数[1]。它实际上比较了建模假设中的方差()和偏差()之间的折衷。这样,在您的情况下,当涉及到偏差项时,它将比较两个不同的对数似然结构。这是因为当您实际上计算对数似然时,您会看两个项:一个拟合项,用和复杂度惩罚项,用ķ 大号2 ķ 2 日志(大号)- 1-1。因此,您会看到两个模型之间的拟合项完全不同;在第一种情况下,您将比较原始数据的残差,而在另一种情况下,将比较记录数据的残差。
除了维基百科,AIC也被定义为等于: [3]; 这种形式更加明显地说明了为什么具有不同因变量的不同模型之间不具有可比性。RSS是两种情况,两者之间是无与伦比的。
Akaike的原始论文[4]实际上很难掌握(我认为)。它基于KL散度(大致来说是两个分布之间的差异),并在证明如何近似数据的未知真实分布并将其与模型所假设的数据分布进行比较方面起作用。这就是为什么“ AIC分数越小越好”的原因;您更接近数据的近似真实分布。
因此,综合起来,使用AIC时要记住的显而易见的事情是三个[2,5]:
您不能使用它来比较不同数据集的模型。
您应该对所有候选模型使用相同的响应变量。
您应该,因为否则您将无法获得良好的渐近一致性。
很抱歉将坏消息告诉您,但是使用AIC来表明您选择的是一个因变量而不是另一个,这在统计上是不行的。检查两个模型中残差的分布,如果记录的数据案例具有正态分布的残差,而原始数据案例则没有,那么您就有了可能需要的所有理由。您可能还想检查原始数据是否对应于对数正态,这也许也足以证明理由。
对于严格的数学假设,游戏是KL散度和信息论。
嗯,还有一些参考资料: