如何计算出样本R平方?


10

我知道这可能已经在其他地方讨论过了,但是我还没有找到明确的答案。我正在尝试使用公式计算线性回归模型的样本外,其中是残差平方的总和,而是平方总和。对于训练集,很明显R 2 S S R S S T[R2=1个-小号小号[R/小号小号Ť[R2小号小号[R小号小号Ť

小号小号Ť=Σÿ-ÿ¯Ť[R一个一世ñ2

那测试集呢?我应该继续使用来代替样本还是使用?ý ˉ ýË小号ÿ¯Ť[R一个一世ñÿÿ¯ŤËsŤ

我发现如果我使用,则有时生成的可能为负。这与sklearn 函数的描述一致,他们使用(他们的linear_model 函数也使用它来测试样本)。他们指出“不管输入特征如何,始终预测y期望值的恒定模型将获得0.0的R ^ 2得分。”- [R2 ˉ ýË小号ÿ¯ŤËsŤ[R2r2_score()ÿ¯ŤËsŤscore()

但是,在其他地方,人们喜欢在这里这里使用(dmi3kno的第二个答案)。所以我想知道哪个更有意义?任何评论将不胜感激!ÿ¯Ť[R一个一世ñ

Answers:


3

你是对的。

OSR残差基于测试数据,但基线仍应为训练数据。这样说,您的SST为 ; 请注意,相同2小号小号Ť=Σÿ-ÿ¯Ť[R一个一世ñ2[R2


3
尽管我已修复了先前编辑中的一些明显错误和一些明显错误,但某些符号和某些预期含义仍然不清楚。
尼克·考克斯

感谢您的回答!您对此有参考吗?似乎stat软件通常使用y_test吗?
Matifou

您对此有参考吗?当然,如果您将作为偏差的比较,那么就对可能性进行比较,我认为您是对的。但是,如果将作为解释方差的比例,则不会,因为平方的总和不会出现在任何地方。[R2[R2
Firebug
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.