给定顺序逻辑回归模型,您如何预测响应类别?


13

我想预测一个健康问题。我按顺序排列了3个结果类别:“正常”,“轻度”和“严重”。我希望从两个预测变量(测试结果(连续,区间协变量)和有此问题的家族史(是或否)中进行预测。在我的样本中,概率为55%(正常),35%(轻度)和10%(严重)。从这个意义上讲,我总是可以预测“正常”,并且在55%的时间是正确的,尽管这不会给我有关单个患者的任何信息。我适合以下模型:

the cut point for (y1)^=2.18the cut point for (y2)^=4.27β^test=0.60β^family history=1.05

假设没有交互,并且模型一切正常。一致性c为60.5%,我认为这是该模型所提供的最大预测准确性。

我遇到了两名新患者,他们的数据如下:1.测试= 3.26,家庭= 0;2.测试= 2.85,家庭=1。我想预测他们的预后。使用公式: (然后服用之间的累积概率的差异),我可以计算在类别上的模型条件的响应的概率分布。R代码(nb,由于舍入问题,输出不完全匹配):

exp(XβcutPoint)(1+exp(XβcutPoint))
cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X    <- rbind(c(3.26, 0), c(2.85, 1))

pred_cat1      <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3      <- 1-pred_cat2.temp
pred_cat2      <- pred_cat2.temp-pred_cat1

predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)

即:1. 0 = 55.1%,1 = 35.8%,2 = 9.1%;和2。0= 35.6%,1 = 46.2%,2 = 18.2%。我的问题是,如何从概率分布转到预测的响应类别?

我使用样本数据尝试了几种可能的结果,这些结果是已知的。如果我只选择max(probabilities),则准确性为57%,比null略有改善,但低于一致性。而且,在样本中,这种方法从未选择“严重”,这是我真正想知道的。我尝试通过将空值和模型概率转换为几率,然后选择max(odds ratio)的贝叶斯方法。偶尔会出现“严重”的情况,但准确度会下降49.5%。我还尝试了按概率和舍入加权的类别总和。同样,它永远不会选择“严重”,并且准确性低51.5%。

采用上述信息并得出最佳准确度(60.5%)的方程是什么?

Answers:


11

Yrmslrmpredict.lrm


1
谢谢你的帮助。我怀疑严重的低频率是问题的一部分。我认为我的原始Y(0 1 2)没有足够相等的时间间隔。我认为我的目标是错误的。不幸的是,我觉得我想知道新的患者会陷入/不完全了解我的目标是什么什么类别应该是。是否可以提供更多的见解?(实际上,我怀疑CV并不是一个完整课程的论坛;或者,您知道我可以从哪个地方学到这个问题吗?我已经阅读了Agresti的Intro&Hosmer&Lemeshow的Logistic部分,但无济于事。)
贡-恢复莫妮卡

1
目标由所需的决定或主题决定。如果您说出最终目标,我也许可以发表评论。
Frank Harrell

对不起,我缺乏明确性,上面似乎也存在问题。目前,我希望能够预测新病例的结果。从长远来看,我想更好地了解ord log reg,例如,如果您没有预测的类别,如何获得残差?我收集的精度可能会略高一些,但我不知道如何获得。我敢肯定您没有时间解释所有事情,但是Agresti和H&L都没有对预测或残差说任何话。因此,我问简历。感谢您一直以来的协助。
gung-恢复莫妮卡

Yjj

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.