回归比率,又称克朗马尔问题


14

最近,随机浏览的问题引发了我的一位教授几年前对临时评论的记忆,并警告说在回归模型中使用比率。因此,我开始阅读此书,最终导致Kronmal 1993。

我想确保我正确解释了他关于如何建模这些建议的建议。

  1. 对于在从属和独立方面均具有相同分母比率的模型:
    ž-1个ÿ=ž-1个1个ñβ0+ž-1个XβX+βž+ž-1个ϵ

    • 除其他比率外,还依赖于(反)分母变量的回归相关比率
    • 分母变量(反)的权重
  2. 对于具有因变量作为比率的模型:
    ÿ=β0+βXX+ž1个ñα0+žXαX+ž-1个ϵ

    • 用原始变量,分母和分母乘以原始变量的回归分子[分类变量是什么?]
    • 权重(反分母)
  3. 对于仅具有独立变量比率的模型: ÿ=β0+XβX+ž-1个1个ñβž-1个+w ^βw ^+ž-1个w ^βž-1个w ^+ϵ

    • 包括分子和(反)分母为主要作用,比率为相互作用项。

我的解释在这里正确吗?

Answers:


1

您确实应该链接到Kronmal论文(并直接从论文中解释了您的表示法。)您对论文的阅读太直白了。具体来说,他没有提供有关加权的建议,而是说可以通过通常的方式进行加权,因此无需讨论。仅作为一种可能性提及。阅读您的案例更像是示例,尤其是作为如何分析此类情况的示例。

在第6节中,他确实提供了一些一般性建议,我将在这里引用:

本文的信息是比率变量应仅在完整线性模型的环境中使用,其中包含构成比率的变量,并且还存在截距项。在回归分析中对因变量或自变量使用比率的常见做法可能导致误导性推断,并且很少会带来任何收益。但是,这种做法十分普遍且根深蒂固,可能难以说服某些研究人员应该放弃他们最珍贵的比率或指数。

本文使用了内曼(Neyman)关于出生和鹳的(虚构)例子。要播放该示例,可以通过以下方式从R访问它

data(stork, package="TeachingDemos")

我将把乐趣留给读者,但是其中一个有趣的情节是coplot

内曼鹳示例的条件图

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.