关于读取列线图的说明


10

以下是使用rms软件包从mtcars数据集创建的列线图:

mpg ~ wt + am + qsec

在此处输入图片说明

R2为0.85,P <0.00001,模型本身看起来不错

> mod

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

我不清楚这些“点”,“总点”和“线性预测器”是什么。其中哪一个代表mpg,即结果变量?我将不胜感激。

编辑:考虑到@Glen_b的出色建议,以便于阅读点等,以下可能是另一列诺模图:

在此处输入图片说明

由于结果或响应变量可用,因此可以代替术语“线性预测变量”来使用。关于如何读取列线图也变得不言自明。


在那里编辑的漂亮图表
Glen_b-恢复莫妮卡2015年

Answers:


11

好吧,由于您的模型是线性的,并且预期的mpg等于线性预测变量,因此您可以直接从线性预测变量范围读取mpg。

对于每个变量,您都可以在相关范围内找到其值。例如,假设我们想找到具有以下特征的汽车的预期mpg wt=4, am=1, qsec=18

在此处输入图片说明

预测的mpg约为18.94。代入方程式得出18.95,所以这非常接近。(实际上,您可能只会工作到最接近的整数点,因此可以获得2个数字的精度-“ 19 mpg”,而不是这里的3-4个数字。)

在我看来,这种图表的主要好处之一是,您可以立即看到不同预测变量(IV)的变化对响应(DV)的相对影响。即使您不需要该图进行任何计算,它也可以在仅显示变量的相对影响方面具有很大的价值。


评论的后续问题:

非线性或多项式回归的工作方式是否相同?

E(Y)y^=b0+bx1+f(x2)

其中:

f

f

x1

x2f

在此处输入图片说明

x2

在此处输入图片说明

f(x)x=2.23

此类功能可能有多个转折点,刻度会多次折断和翻转-但轴线只有两个侧面。

对于点型列线图,这没有任何困难,因为可以将其他比例部分向上或向下移动(或更普遍地,垂直于轴的方向)直到没有重叠发生。

(对齐类型的列线图可能会有多个转折点; Harrell的书中所示的一种解决方案是将所有比例尺从参考线略微偏移,该参考线实际上就是该值的位置。)


Y

所有这些情况的示例可以在Harrell的回归建模策略中找到



只是一些注意事项

  1. 我更希望在相关部分的顶部和底部看到两个点的比例;否则很难准确地“排队”,因为您必须猜测什么是“垂直”。像这样:

    在此处输入图片说明

    但是,正如我在评论中指出的那样,对于图表的最后部分(总点和线性预测变量),也许更好的替代第二点比例尺的方法是简单地使用一对背对背比例尺(一个点的总点另一方面,线性预测变量),如下所示:

    在此处输入图片说明

    因此,我们避免了知道什么是“垂直”的需要。

  2. 仅使用两个连续的预测变量和一个二进制因子,我们就可以很容易地构造出更传统的比对诺模图

    在此处输入图片说明

    在这种情况下,您只需按比例找到wtqsec值,然后用一条线将它们连接起来;它们越过mpg轴的位置,我们读取该值(而am变量确定所mpg读取的轴的哪一侧)。在这样的简单情况下,这类列线图更快,更易于使用,但对于许多预测变量的泛化却不那么容易,因为这些预测变量可能变得笨拙。问题中的点式列线图(在回归建模策略中以及rms在R 中的包中实现)可以无缝添加更多变量。在处理交互时,这可能是一个很大的优势。


感谢您提供清晰的图示说明。非线性或多项式回归的工作方式是否相同?
rnso

1
我已经编辑了答案以回答这个附加问题。
Glen_b-恢复莫妮卡2015年

2
这是Glen的精彩文章。我想我将修改nomogram函数的plot方法以Points默认情况下添加额外的比例。很棒的建议!
Frank Harrell 2015年

1
@FrankHarrell否,因为您没有阅读积分与总积分之间的任何关系-甚至不需要在同一页面上。问题是找到“垂直”,因此您可以从总点准确读取线性预测变量。如果这两个刻度非常接近或接触,而不是说相隔两英寸,那不是问题。当它们相距几英寸时,在找到垂直方向时可能会出现一些误差,这意味着结果中会有相当多的误差。不过,在第一部分中,您仍然需要两个点数比例尺,因为您可以有很多预测变量,并且它们不可能都与点数比例尺相邻。
Glen_b-恢复莫妮卡2015年

1
@FrankHarrell就我个人而言,我认为网格会使显示混乱,并倾向于掩盖其价值;我会尽量避免使用网格。除非网格像比例尺一样精细(我认为这在视觉上会很糟),否则它们也不允许以相同的精度获得垂直度,如果没有选择的话,我最终将在第二点比例尺中进行编辑(就像我在此处所做的那样),使其处于我认为具有的两个目的的可用状态(即,对预测值进行合理准确的估算,而不会模糊ii。相对贡献的清晰度)
Glen_b-恢复莫妮卡2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.