如何描述或可视化多元线性回归模型


21

我正在尝试使用几个输入参数(例如3)将多元线性回归模型拟合到我的数据中。

(一世)FX=一种X1个+X2+CX3+d要么(ii)FX=一种  CŤX1个 X2 X3+d

如何解释和可视化此模型?我可以想到以下选项:

  1. 提及描述的回归方程(系数,常数)以及标准偏差,然后提及残差图以显示该模型的准确性。 一世

  2. 独立变量和因变量的成对图,如下所示:

    在此处输入图片说明

  3. 一旦系数已知,可以将用于获得方程式的数据点压缩为它们的实际值。也就是说,训练数据具有而不是,,,形式的新值,其中每个自变量乘以其各自的系数。然后,可以将此简化版本直观地显示为简单回归,如下所示:x x 1 x 2 x 3一世XX1个X2X3

    在此处输入图片说明

尽管对此主题进行了适当的介绍,但我对此还是感到困惑。有人可以向我解释如何“解释”多元线性回归模型以及如何直观地显示它。


2
您的文档的目的是什么?受众是谁?我将从获得相似的文章开始,并寻找一些有关如何在您自己的领域中完成它们的示例。我对生物医学文献更加熟悉,大多数时候,我们只是使用一张桌子。当作者尝试解释一种互动时,通常会看到插图。
Penguin_Knight 2014年

@Penguin_Knight,这是计算机科学领域,但是我认为这是通用的,而不是局限于特定领域。如果我错了,请纠正我。
克里斯2014年

嗯...虽然有问题。我要说的是,对我而言,唯一的通用部分是显示的内容不超出您的应有的,并确保要强调的组成部分得到真正强调。即使在我的领域,我也看到了所有三个选择。1)将结果制成表格是最常见的,其次是3),但多数是绘制预测结果的形式,然后是2)。但对于2),我会使用@gregory_britten建议的内容:使用调节X,而不是每个人X.
Penguin_Knight

使用分布图。...查看由模型得出的拟合值的分布,并将其与实际值的分布进行比较。
owais qureshi

我知道这是几年前的事,但是如果您在这里重新访问,是否可以发布数据?这样,人们将可以使用一些东西来展示不同的可能性。
gung-恢复莫妮卡

Answers:


21

XΔY/Δsd(X)。这样,系数从零开始的距离就排列了它们的相对“重要性”,它们的CI给出了精度。我认为它很好地总结了这些关系,并且比自然和经常不同的数字尺度上的系数和p值提供了更多的信息。下面是一个示例:

在此处输入图片说明

YXiYX1+X2+X3XiÿavPlots()carlm

在此处输入图片说明


感谢@gregory_britten提供此信息。我手头的问题有8个独立变量。您认为对于大量输入变量而言,“增加变量图”是否合理?
克里斯(Kris)2014年

与第一个绘图的想法一致,如果在R中工作,我建议您查看RMS软件包,它使所有这一切变得容易。令人高兴的是,人们可以要求协方差的有意义的阶跃变化,从而避免了标准化的需要。
Thomas Speidel 2014年

@suzanne绝对是。添加的变量图为您提供了任意数量的变量的二维透视图。在更高的尺寸上可能会特别明显。人们通常发现在人都不明显在观察Y的残差揭示模式
gregory_britten

在这种情况下,我不太了解X1 | X2&X3表示法。我知道它是如何用于概率的,但是我不太明白它在这里说什么
Casebash 2014年

1
@Casebash这是模型中给定X2和X3的X1的部分回归
gregory_britten 2014年

1

由于它们都与解释肝硬化的起因有关,您是否尝试制作气泡图/圆形图并使用颜色表示不同的回归指标,并使用圆半径表示对肝硬化的相对影响?

我在这里指的是如下所示的Google图表类型:在此处输入图片说明

另外,除非我没有读错你的图,否则我认为你那里有一些多余的回归变量。葡萄酒已经是一种酒,因此,如果您的目标是解释肝硬化的发生率,那么如果这两个是单独的回归变量,则将它们都保留是没有意义的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.