回归模型中的左侧和右侧命名法


10

y=β0+β1x1+ε0

描述回归模型的语言(例如上面指定的非常简单的线性回归)通常会发生变化,并且这种变化通常会在含义上产生细微的变化。例如,方程式左侧的模型部分可以用括号(包括我不知道的其他术语)来表示:

  • 因变量(因果关系提示)
  • 预测变量(暗示模型预测/进行预测)
  • 响应变量(暗示因果关系,或至少是时间顺序)
  • 结果变量(暗示因果关系)

命名法的变化在等式的右侧也是正确的(相同的免责声明是我对其他术语不了解):

  • 自变量(暗示因果优先级,暗示实验设计)
  • 预测变量(暗示预测,意味着该变量具有与之关联的非零参数估计)

在提议审查或交流研究的过程中,我不仅有机会使用一个或另一个术语来称呼它,而且后来又以我选择用它代替的术语来称呼它。虽然打电话的人当然是学徒的(注:我是专业的学徒,所以我很同情),但是由于我们所有人都知道所传达的内容,我仍然想知道:

回归模型中是否存在左,右变量的常用术语,这些术语与(a)模型的外部用途,(b)变量之间的因果关系以及(c)研究方面无关用来产生变量的设计本身?

注意:我不是在问正确建模和正确解释的重要问题(即,我非常在意因果关系,研究设计等),而是对一种语言进行一般讨论更感兴趣。

(我想我认为“左手变量”和“右手变量”可能被解释为一个可靠的答案,但是这些术语似乎很笨拙……也许这是一个笨拙的问题。:)


对此不应有任何混淆。
卡尔,

1
我认为简短的答案是“否”。我认为这是有充分理由的。在正式实例中,用于识别变量的语言应细微入微,以暗示模型预期的应用程序/领域中的杰出解释(即,了解回归模型中是否隐含因果关系非常重要,正确使用命名法会有所帮助)有了这个)。
Zachary Blumenfeld 2016年

2
@ZacharyBlumenfeld(a)不要在评论中回答。:)(b)但是,我们一般都在谈论“回归”本身,而不求助于研究设计,学科知识领域等。(例如,许多人在不使用研究设计,因果关系的情况下谈论和撰写最小二乘估计量等)。如果我们有一种与应用程序无关的语言来描述广泛的统计工作,那么为什么对于这些​​工作的组成部分没有类似的不可知论语言呢?
亚历克西斯

1
X(XX)1XyyX

1
@Kenji我完全同意您的大部分观点。但是,我不同意一个人只能/只能讨论一个应用案例中的回归方程:我们应该拥有一种可以谈论所有回归模型左右手变量的语言,例如,在研究此类方法的应用时在跨学科的元层面上。
Alexis

Answers:


6

这是一个很好的问题。实际上,它是如此好,以至于没有答案。据我所知,没有真正的“不可知论”来形容Y。

从我的经验和阅读中,我发现语义是特定于领域的,也是特定于模型目标的。

计量经济学家在构建说明性模型时将使用因变量项。他们在构建预测模型时可能会使用术语“预测”,“拟合”或“估计变量”,该模型更侧重于准确的估计/预测而不是理论上的解释力。

大数据/深度学习人群使用完全不同的语言。而且,他们通常会使用术语“响应”变量或“目标”变量。他们的模型是如此黑匣子,以至于他们通常不试图解释现象而是预测并准确估计。但是,使用Predicted一词不会以某种方式捕获它们。他们更喜欢术语“响应”或“目标”。

我不太熟悉术语“结果变量”。它可能在我较少接触的其他领域中普遍存在,例如社会科学,包括心理学,医学,临床试验,流行病学。

鉴于上述情况,我无法为您提供用于描述Y的任何“不可知论”语义。相反,我提供了一些有关在迎合不同受众时使用哪种语义以及反映模型目标的信息。总而言之,如果您谈论计量经济学家的因变量和深度学习类型的响应或目标变量,我认为不会有人受到伤害。希望您可以将这些人群分开,否则您可能会进行口头食物大战。


我希望我能为“口头食物大战”额外投票:D
亚历克西斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.