二项式条件下未来成功比例的预测间隔


9

假设我拟合了二项式回归并获得了点估计和回归系数的方差-协方差矩阵。这样一来,我就可以为将来的实验的预期成功比例获得CI ,但是我需要为观察到的比例获得CI。已经发布了一些相关的答案,包括模拟(假设我不想这样做)和指向Krishnamoorthya等人的链接(并不能完全回答我的问题)。p

我的推理如下:如果仅使用二项式模型,则不得不假定是从正态分布中采样的(具有相应的Wald CI),因此不可能以封闭形式获得观察比例的CI。如果我们假设p是从beta分布中采样的,那么事情就容易多了,因为成功次数将遵循Beta-Binomial分布。我们将不得不假设估计的beta参数αβ没有不确定性ppαβ

有三个问题:

1)理论上:仅使用beta参数的点估计值可以吗?我知道在多元线性回归中构造CI以便将来观察

ÿ=Xβ+ϵϵñ0σ2

他们这样做的WRT误差项方差,。我把它(如果我错了纠正我)的理由是,在实践中σ 2估计比回归系数远远更高的精度,我们不会得到太多的试图将不确定性σ 2。类似的理由适用于估计的beta参数αβ吗?σ2σ2σ2αβ

2)哪种软件包更好(R:gamlss-bb,betareg,odd ?;我也可以使用SAS)。

3)给定估计的beta参数,是否有(近似)捷径来获得未来成功计数的分位数(2.5%,97.5%),或者更好的是,根据Beta-Binomial分布获得未来成功的比例。


在第一个问题上,是的,这是人们做的正确的事情,称为经验贝叶斯:en.wikipedia.org/wiki/Empirical_Bayes_method
Paul

1
我认为使用XYZ方法估计模型参数不会自动暗示在为将来的观察生成CI时可以忽略估计不确定性。例如,在多元线性回归中,他们使用OLS代替EB,并且的不确定性也被忽略。这是为什么?而且,该Wiki文章从不建议在EB中顶级超参数的估计精度通常要高得多,以至于出于实际目的考虑将其固定是可以的。σ
詹姆斯

1
“当真实分布是急剧见顶,积分确定p θ | Ý 可以没有太大通过更换过的概率分布变化η用点估计η *代表分布的峰”。在您的情况下,这是否正确取决于问题领域的具体情况。pηÿpθÿηη
保罗

2
好问题!您无法获得支点,但是如何使用轮廓可能性呢?请参阅有哪些非贝叶斯方法可用于预测推理?
Scortchi-恢复莫妮卡

Answers:


1

我将解决这个问题的所有三个部分。

有两个混淆的问题,首先是在这种情况下用于拟合回归模型的方法。第二个是如何将估计值与估计值间隔开来以预测新的估计值。

如果您的响应变量是二项分布的,则通常将使用逻辑回归或概率回归(glm与正常cdf作为链接函数)。

ÿ一世/ñ一世

x<- rnorm(100, sd=2)
prob_true <- 1/(1+exp(-(1+5*x)))
counts <- rbinom(100, 50,prob_true)
print(d.AD <- data.frame(counts,x))
glm.D93 <- glm(counts/50 ~ x, family = binomial() )

对于线性回归模型,预测间隔的公式为:

ÿ^一世±Ťñ-psÿ1个+1个ñ+X一世-X¯2ñ-1个sX2

您可以将线性回归模型用作glm的近似值。为此,在进行逆链接转换以使概率重新回到0-1规模之前,您需要为预测变量的线性组合建立线性回归公式。执行此操作的代码已包含在predict.glm()R函数中。这是一些示例代码,它们也会绘制出一个漂亮的图。(编辑:此代码用于置信区间,而不是预测区间)

y_hat <- predict(glm.D93, type="link", se.fit=TRUE)
t_np<- qt(.975, 100-2, ncp=0)

ub <- y_hat$fit + t_np * y_hat$se.fit
lb <- y_hat$fit - t_np * y_hat$se.fit

point <- y_hat$fit

p_hat <- glm.D93$family$linkinv(point)
p_hat_lb <- glm.D93$family$linkinv(lb)
p_hat_ub <- glm.D93$family$linkinv(ub)

plot(x,p_hat)
points(x, p_hat_ub, col='red')
points(x, p_hat_lb, col='blue')

您可以对任何glm(例如,泊松,逆高斯,伽玛等)执行相同的操作。在每种情况下,都应按预测变量线性组合的尺度来进行预测间隔。获得预测间隔的两个端点后,可以通过反向链接转换这些端点。对于我提到的每种glms,反向链接可能与我在此处编写的logit情况不同。希望这可以帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.