比率分析技术


13

我正在寻找有关比率和费率分析的建议和意见。在我工作的领域中,尤其是比率的分析非常普遍,但是我已经阅读了几篇论文,表明这可能是有问题的,我在想:

Kronmal,Richard A.1993。重新讨论了比率标准的虚假相关和谬误。皇家统计协会杂志A 156(3):379-392

及相关论文。根据我到目前为止所读的内容,比率似乎可以产生虚假的相关性,迫使回归线穿过原点(这并不总是合适的),并且如果不正确地进行建模,可能会违反边际原理(理查德·戈德斯坦(Richard Goldstein)中使用比率回归))。但是,在某些情况下必须合理使用比率,我希望统计学家对此发表一些意见。


在分母可以采用包括零的范围内的值的情况下,它们特别成问题。
DWin

Answers:


7

我不会将观察到的相关性称为虚假的,而是从这些相关性中得出虚假的因果推论。比率问题与其他类型的混杂问题类似。

如果定义随机变量和,其中,和是独立的,则 和是相关的。这可能会误导您以为与之间存在因果关系,反之亦然,或者从以外的因果关系到两者。但是,仅决定避免使用比率是没有用的。观测值本质上不是比率,并且如果,和是独立的,则将使用比率引入“虚假”相关U=XQV=YQXYQUVXYQUVQX=U1/Q和。在您的分析中包括,并且需要注意的是,按 “缩放” 并非同一件事†-无论您使用哪种,都可以保护您;但不是来自其他混杂因素Y=V1/QQQR,S,T,

Aldrich(1995),““皮尔逊和尤尔的相关性的真实和虚假”,《统计科学》,第10卷,第4期,提供了令人印象深刻的历史视角。

†请参阅在模型中包括相互作用,但不包括主要影响

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.