我对估算调整后的风险比率很感兴趣,类似于人们如何使用logistic回归估算调整后的优势比率。一些文献(例如this)表明,将泊松回归与Huber-White标准误差一起使用是基于模型的方法
我没有找到关于调整连续协变量如何影响这一点的文献。下面的简单模拟表明此问题并非那么简单:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
在这种情况下,真实风险比为2,当协变量效应较小时,它可以可靠地恢复。但是,当协变量效应很大时,这会失真。我认为这是因为协变量效应会推高上限(1),这会污染估计值。
我看过但没有找到关于调整风险比率估计中的连续协变量的任何文献。我知道此网站上的以下帖子:
但他们没有回答我的问题。是否有任何论文?是否应采取任何已知的注意事项?
1
您可能感兴趣: aje.oxfordjournals.org/content/162/3/199.full
—
StatsStudent
这个问答stats.stackexchange.com/questions/18595/…可能也有帮助。
—
mdewey