使用Poisson回归估算二元数据中调整后的风险比率


9

我对估算调整后的风险比率很感兴趣,类似于人们如何使用logistic回归估算调整后的优势比率。一些文献(例如this)表明,将泊松回归与Huber-White标准误差一起使用是基于模型的方法

我没有找到关于调整连续协变量如何影响这一点的文献。下面的简单模拟表明此问题并非那么简单:

arr <- function(BLR,RR,p,n,nr,ce)
{
   B = rep(0,nr)
   for(i in 1:nr){
   b <- runif(n)<p 
   x <- rnorm(n)
   pr <- exp( log(BLR) + log(RR)*b + ce*x)
   y <- runif(n)<pr
   model <- glm(y ~ b + x, family=poisson)
   B[i] <- coef(model)[2]
   }
   return( mean( exp(B), na.rm=TRUE )  )
}

set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326 

在这种情况下,真实风险比为2,当协变量效应较小时,它可以可靠地恢复。但是,当协变量效应很大时,这会失真。我认为这是因为协变量效应会推高上限(1),这会污染估计值。

我看过但没有找到关于调整风险比率估计中的连续协变量的任何文献。我知道此网站上的以下帖子:

但他们没有回答我的问题。是否有任何论文?是否应采取任何已知的注意事项?



这个问答stats.stackexchange.com/questions/18595/…可能也有帮助。
mdewey

Answers:


1

我不知道您是否仍然需要这个问题的答案,但是我有一个类似的问题,我想使用泊松回归。在运行您的代码时,我发现如果将模型设置为

model <- glm(y ~ b + x, family=binomial(logit)

而不是像您的Poisson回归模型那样,会发生相同的结果:当ce接近1时,估计OR约为1.5。


1
拟合logit模型并不会导致预测的风险大于1的问题是,优势比是风险比的有偏估计量,并且随着结果变得更加普遍,这种偏倚会急剧增加。您可以指定binomial(link=log)实际适合的相对风险模型,但是由于预测结果过高,它很少收敛。
AdamO

1

我发现,将直接最大似然与适当的概率函数一起使用可大大改善相对风险的估计。您可以直接将截短的风险函数指定为流程的预测比率。

在此处输入图片说明

通常,我们使用Hessian创建估计的CI。我尚未探讨过将其用作Huber White错误中的“ B”矩阵(肉)以及使用拟合风险来获得“ A”矩阵(面包)的可能性的可能性,但是我怀疑它可以工作!更可行的是,您可以使用引导程序来获得对错误指定的均方差关系具有鲁棒性的模型误差。

## the negative log likelihood for truncated risk function
negLogLik <- function(best, X, y) { 
  pest <- pmin(1, exp(X %*% best))
  -sum(dpois(x = y, lambda = pest, log=TRUE))
}

set.seed(100)

sim <- replicate(100, {
  n <- 200
  X <- cbind(1, 'b'=rbinom(n, 1, 0.5), 'x'=rnorm(n))
  btrue <- c(log(0.3), log(2), 1)
  ptrue <- pmin(1, exp(X %*% matrix(btrue)))
  y <- rbinom(n, 1, ptrue) ## or just take y=ptrue for immediate results
  nlm(f = logLik, p = c(log(mean(y)),0,0), X=X, y=y)$estimate
})

rowMeans(exp(sim))

给出:

> rowMeans(exp(sim))
[1] 0.3002813 2.0680780 3.0888280

中间系数给您您想要的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.