评估逻辑回归模型


13

我一直在研究逻辑模型,但在评估结果时遇到了一些困难。我的模型是二项式logit。我的解释变量是:具有15个级别的分类变量,二分变量和2个连续变量。我的N大于8000。

我正在尝试为公司的投资决策建模。因变量是投资(是/否),这15个级别变量是经理报告的不同投资障碍。其余变量是销售,信用和已用容量的控件。

下面是我的结果,使用rmsR中的包。

  Model Likelihood     Discrimination    Rank Discrim.    
                         Ratio Test            Indexes          Indexes       
Obs          8035    LR chi2     399.83    R2       0.067    C       0.632    
 1           5306    d.f.            17    g        0.544    Dxy     0.264    
 2           2729    Pr(> chi2) <0.0001    gr       1.723    gamma   0.266    
max |deriv| 6e-09                          gp       0.119    tau-a   0.118    
                                           Brier    0.213                     

          Coef    S.E.   Wald Z Pr(>|Z|)
Intercept -0.9501 0.1141 -8.33  <0.0001 
x1=10     -0.4929 0.1000 -4.93  <0.0001 
x1=11     -0.5735 0.1057 -5.43  <0.0001 
x1=12     -0.0748 0.0806 -0.93  0.3536  
x1=13     -0.3894 0.1318 -2.96  0.0031  
x1=14     -0.2788 0.0953 -2.92  0.0035  
x1=15     -0.7672 0.2302 -3.33  0.0009  
x1=2      -0.5360 0.2668 -2.01  0.0446  
x1=3      -0.3258 0.1548 -2.10  0.0353  
x1=4      -0.4092 0.1319 -3.10  0.0019  
x1=5      -0.5152 0.2304 -2.24  0.0254  
x1=6      -0.2897 0.1538 -1.88  0.0596  
x1=7      -0.6216 0.1768 -3.52  0.0004  
x1=8      -0.5861 0.1202 -4.88  <0.0001 
x1=9      -0.5522 0.1078 -5.13  <0.0001 
d2         0.0000 0.0000 -0.64  0.5206  
f1        -0.0088 0.0011 -8.19  <0.0001 
k8         0.7348 0.0499 14.74  <0.0001 

基本上,我想以两种方式评估回归,a)模型对数据的拟合程度,b)模型对结果的预测程度。为了评估拟合优度(a),我认为基于卡方的偏差测试在这种情况下不合适,因为唯一协变量的数量接近N,因此我们不能假设X2分布。这种解释正确吗?

我可以看到使用epiR包的协变量。

require(epiR)
logit.cp <- epi.cp(logit.df[-1]))

    id n x1   d2 f1 k8
     1 1 13 2030 56  1
     2 1 14  445 51  0
     3 1 12 1359 51  1
     4 1  1 1163 39  0
     5 1  7  547 62  0
     6 1  5 3721 62  1
    ...
    7446

我还读到Hosmer-Lemeshow GoF测试已过时,因为它将数据除以10即可运行测试,这相当随意。

相反,我使用了Le Cessie–van Houwelingen–Copas–Hosmer测试,该测试在 rms包装中。我不确定该测试的执行方式,我还没有阅读有关它的论文。无论如何,结果是:

Sum of squared errors    Expected value|H0           SD             Z            P
         1711.6449914         1712.2031888    0.5670868    -0.9843245    0.3249560

P很大,因此没有足够的证据表明我的模型不合适。大!然而....

在检查模型(b)的预测能力时,我画了一条ROC曲线,发现AUC为0.6320586。看起来不太好。

在此处输入图片说明

因此,总结一下我的问题:

  1. 我运行的测试是否适合检查模型?我还能考虑其他哪些测试?

  2. 您是否认为该模型很有用,还是会基于相对较差的ROC分析结果而忽略该模型?


您确定您x1应将其视为单个类别变量吗?也就是说,每种情况下是否都必须有1个且只有1个“障碍”才能进行投资?我认为某些情况下可能会遇到两个或多个障碍,而某些情况下则没有。
gung-恢复莫妮卡

Answers:


6

一个人可以应用成千上万的测试来检验逻辑回归模型,而这些测试很大程度上取决于一个人的目标是预测,分类,变量选择,推理,因果建模等。例如,Hosmer-Lemeshow测试可以评估模型校准以及预测值是否按风险指标划分时是否趋于与预测频率匹配。尽管选择10是任意的,但是该测试具有渐近结果并且可以轻松修改。当在用于估计逻辑回归模型的相同数据上计算时,HL检验以及AUC的结果(在我看来)非常无趣。像SAS和SPSS之类的程序经常对统计数据进行频繁报告以进行截然不同的分析,这真是一个奇迹。事实逻辑回归结果的表示方式。预测准确性的测试(例如HL和AUC)最好与独立的数据集一起使用,或者(甚至更好)在不同时间段内收集的数据来评估模型的预测能力。

需要说明的另一点是,预测和推断是完全不同的东西。没有客观的方法可以评估预测,0.65的AUC非常适合预测非常罕见和复杂的事件,例如1年乳腺癌风险。类似地,可以推论推理是任意的,因为通常会抛出传统的误报率0.05。

如果我是您,那么您的问题描述似乎对建模经理报告的投资“障碍”的效果感兴趣,因此请着重介绍模型调整后的关联。给出模型比值比的点估计和95%置信区间,并准备与他人讨论它们的含义,解释和有效性。森林图是有效的图形工具。您还必须在数据中显示这些障碍的发生率,并通过其他调整变量来说明它们的中介作用,以证明在未调整结果中混淆的可能性是小还是大。我会走得更远,探索诸如克朗巴赫(Cronbach)α这样的因素来确定经理报告的障碍之间的一致性,以确定经理是否倾向于报告类似的问题,或者

我认为您过于关注数字而不是眼前的问题。良好的统计数据展示中有90%是在模型结果展示之前进行的。


谢谢亚当的回复!我的大部分分析都是基于比值比解释和预测的概率。但是由于我对Logistic回归还不太满意,我担心我的分析会被驳回,因为我缺少一些通用的模型拟合检验。但是正如您所说,我也相信我应该专注于对模型进行更实质性的解释。我将考虑您对林地和克伦巴赫(Cronbach)的Alpha的建议。再次感谢!
Federico C

给定您的问题描述,唯一合理地潜在违反模型假设的条件就是相关数据。请记住,您可以使用准二项式回归模型进行离散度测试,也可以尝试按行业类型(针对您提到的各种公司)进行子组分析,或者再次尝试进行聚类分析。
2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.