在物流回归中使用“预测”一词有多公平?


9

我的理解是,即使回归也不能给出因果关系。它只能给出y变量和x变量以及可能的方向之间的关联。我对么?即使在大多数课程教科书和在线的各种课程页面上,我也经常发现类似于“ x预测y”的短语。您通常将回归变量称为预测变量,将y称为响应。

  1. 将其用于线性回归有多公平?
  2. 逻辑回归如何?(如果我确实有一个阈值t,可以与之比较概率?)

1
只要您意识到没有办法预测错误部分,它就完全是随机的,就可以使用它。
Aksakal,2015年

1
没有错误部分,随机的或其他的。
Frank Harrell 2015年

Answers:


21

使用“预测”一词没有问题。

重要的是要认识到预测与因果关系无关。考虑一种情况,其中大多数在医院急诊室死亡的人死于心脏病。如果您听说患者死亡,但不知道原因,则可以预测可能是心脏病发作,因为您知道心脏病发作占50%以上。您正在做出预测,但是您是在从已知影响中预测未知原因。同样,此示例中的预测是分类的,因此它类似于逻辑回归。(比喻可能比多项式逻辑回归更强,但这并不重要。)

就其价值而言,预测根本不必与任何直接因果关系有关。只要关系是可靠的,就可以基于虚假相关进行预测。考虑根据双胞胎的同胞预测同卵双胞胎的未知高度。在这种情况下,两个高度都是一组共同原因(共同的遗传和环境)的影响。两个双胞胎的高度都不是另一个的原因或结果。但是,在这种情况下您可以做出很好的预测。


“虚假回归”示例+1!
PatrickT
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.