我正在研究如何根据逻辑回归中获得的系数为比值比构建95%的置信区间。因此,考虑逻辑回归模型,
这样,对于对照组,,对于病例组,。
我已经读过,最简单的方法是为\ beta构造95%CI,然后我们应用指数函数,即
我的问题是:
证明该程序合理的理论原因是什么?我知道并且最大似然估计是不变的。但是,我不知道这些元素之间的联系。
增量法是否应该产生与先前步骤相同的95%置信区间?使用增量法
然后,
如果没有,那是最好的程序?
我正在研究如何根据逻辑回归中获得的系数为比值比构建95%的置信区间。因此,考虑逻辑回归模型,
这样,对于对照组,,对于病例组,。
我已经读过,最简单的方法是为\ beta构造95%CI,然后我们应用指数函数,即
我的问题是:
证明该程序合理的理论原因是什么?我知道并且最大似然估计是不变的。但是,我不知道这些元素之间的联系。
增量法是否应该产生与先前步骤相同的95%置信区间?使用增量法
然后,
如果没有,那是最好的程序?
Answers:
Tibshirani,James,Hastie 的著作“统计学习入门”在第267页上提供了工资数据上多项式逻辑回归度4的置信区间的示例。报价书:
我们使用4级多项式进行逻辑回归对二元事件进行建模。拟合后的工资超过250,000美元的概率以蓝色显示,以及估计的95%置信区间。
下面是构造此类间隔的两种方法的快速回顾,以及有关如何从头开始实现它们的注释
因为是一个单调变换
具体而言,这意味着计算,然后将logit变换应用于结果以获取上下限:
最大似然理论告诉我们,可以使用回归系数的协方差矩阵使用以下公式计算的近似方差:
将设计矩阵和矩阵为
其中是第个观测值的第个变量的值, 表示观测到的预测概率。
然后可以找到协方差矩阵: ,标准误为
然后可以将预测概率的95%置信区间绘制为
该方法是计算函数的线性逼近的方差,并使用它来构建较大的样本置信区间。
其中是梯度,是估计的协方差矩阵。请注意,在一维中:
其中是的导数。这在多变量情况下是普遍的
在我们的情况下,F是逻辑函数(我们将表示),其导数为
现在,我们可以使用上面计算的方差构造一个置信区间。
多变量案例的矢量形式
查看概率和负对数几率的正态QQ图可知,两者均不是正态分布。这可以解释差异吗?
资源: