时间序列上混合效应模型的预测值总和的方差


32

我有一个混合效果模型(实际上是广义加性混合模型),可以为我提供时间序列的预测。考虑到我缺少数据,我使用corCAR1模型来抵消自相关。数据应该给我带来了总的负担,所以我需要对整个预测间隔求和。但我也应该估算出该总负载下的标准误差。

如果所有预测都是独立的,则可以通过以下方式轻松解决:

V a r E [ X i ] = S E E [ X i ] 2V一种[R一世=1个ñË[X一世]=一世=1个ñV一种[RË[X一世] withV一种[RË[X一世]=小号ËË[X一世]2

问题是,预测值来自模型,原始数据具有自相关。整个问题导致以下问题:

  1. 我是否可以假设将计算得出的预测的SE解释为该预测的期望值的方差根部,这是正确的吗?我倾向于将预测解释为“平均预测”,因此总结了一系列的均值。
  2. 如何在这个问题中包含自相关,或者我可以安全地假设它不会对结果产生太大影响?

这是R中的一个例子。我的真实数据集约有34.000个测量值,因此可伸缩性是一个问题。这就是为什么我在每个月内对自相关建模的原因,否则就无法进行计算了。这不是最正确的解决方案,但是最正确的解决方案却不可行。

set.seed(12)
require(mgcv)

Data <- data.frame(
    dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)

Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})

model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)

preds <- predict(model$gam,se=T)

Total <- sum(preds$fit)

编辑:

要学习的经验:惊慌失措之前,请先仔细阅读所有帮助文件中的所有示例。在predict.gam的帮助文件中,我可以找到:

#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################

Xp <- predict(b,newd,type="lpmatrix") 

## Xp %*% coef(b) yields vector of predictions

a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)

这似乎与我想做的很接近。这仍然不能完全告诉我它是如何完成的。我可以理解它基于线性预测矩阵的事实。仍然欢迎任何见解。


6
v一种[R一世Ë[X一世]=一种Ťv一种[RË[X]一种
一种v一种[RË[X]Ë[X]=Ë[X1个]Ë[Xñ]Ť

@probabilityislogic这基本上是r程序正在做的事情。数学上的
感谢

2
@probabilityislogic如果可以将其包装为答案,则可以获取我的+50赏金。;)
e-sushi

ËX一世=μ一世一世=1个ñV一种[RË[X一世]=0

@ user52220那是你错了。E(Xi)是期望值,因此是一个随机变量,而mu_i是总体的平均值,因此是一个固定数。Var(mu)= 0,但对于E(Xi)来说是不正确的。
Joris Meys 2015年

Answers:


1

用矩阵表示法可以将混合模型表示为

y = X * beta + Z * u + epsilon

其中X和Z是分别与固定效应和随机效应观测有关的已知设计矩阵。

我将应用一个简单而适当的(但不是最好的)变换来校正自相关,这涉及丢失第一个观察值,并将[y1,y2,... yn]的列向量替换为较小的一个观测列向量,即:[y2-rho * y1,y3-rho * y2,...,yn-rho * y(n-1)],其中rho是您用于串行自相关的估计值。

这可以通过乘以矩阵T形成T * y来完成,其中T的第一行组成如下:[-rho,1,0,0,....],第二行:[0, -rho,1、0、0,...]等。类似地,其他设计矩阵更改为T * X和T * Z。同样,误差项的方差-协方差矩阵也被更改,现在具有独立的误差项。

现在,只需使用新的设计矩阵计算解决方案即可。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.