我想预测一个健康问题。我按顺序排列了3个结果类别:“正常”,“轻度”和“严重”。我希望从两个预测变量(测试结果(连续,区间协变量)和有此问题的家族史(是或否)中进行预测。在我的样本中,概率为55%(正常),35%(轻度)和10%(严重)。从这个意义上讲,我总是可以预测“正常”,并且在55%的时间是正确的,尽管这不会给我有关单个患者的任何信息。我适合以下模型:
假设没有交互,并且模型一切正常。一致性c为60.5%,我认为这是该模型所提供的最大预测准确性。
我遇到了两名新患者,他们的数据如下:1.测试= 3.26,家庭= 0;2.测试= 2.85,家庭=1。我想预测他们的预后。使用公式: (然后服用之间的累积概率的差异),我可以计算在类别上的模型条件的响应的概率分布。R代码(nb,由于舍入问题,输出不完全匹配):
cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X <- rbind(c(3.26, 0), c(2.85, 1))
pred_cat1 <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3 <- 1-pred_cat2.temp
pred_cat2 <- pred_cat2.temp-pred_cat1
predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)
即:1. 0 = 55.1%,1 = 35.8%,2 = 9.1%;和2。0= 35.6%,1 = 46.2%,2 = 18.2%。我的问题是,如何从概率分布转到预测的响应类别?
我使用样本数据尝试了几种可能的结果,这些结果是已知的。如果我只选择max(probabilities),则准确性为57%,比null略有改善,但低于一致性。而且,在样本中,这种方法从未选择“严重”,这是我真正想知道的。我尝试通过将空值和模型概率转换为几率,然后选择max(odds ratio)的贝叶斯方法。偶尔会出现“严重”的情况,但准确度会下降49.5%。我还尝试了按概率和舍入加权的类别总和。同样,它永远不会选择“严重”,并且准确性低51.5%。
采用上述信息并得出最佳准确度(60.5%)的方程是什么?