解释回归模型的方差


13

这可能是一个简单的解释(无论如何我都希望如此)。

我已经使用回归工具箱在Matlab中进行了一些回归分析。但是,我遇到了一项研究指出:

“使用回归分析,可以仅使用四个解释60%差异的声音特征来建立预测模型”

如果需要,可以在此处找到文章的链接: 文章

我不确定这意味着什么,但我希望它简单一些。60%也是一件好事吗?我试图进行搜索,但是由于“方差”一词之前总是有一个百分比,因此很难找到答案。

Answers:


9

我将尝试用简单的术语进行解释。

回归模型着重于变量和一组变量之间的关系。因变量是您尝试使用一个或多个自变量来预测的结果。

假设您有一个这样的模型:

重量i = 3.0 + 35 *高度i +ε

现在,显而易见的问题之一是:该模型的运行情况如何?换句话说,一个人的身高能准确地预测或解释该人的体重吗?

在回答这个问题之前,我们首先需要了解我们在人们的体重上观察到了多少波动。这很重要,因为我们在这里要做的是通过使用他们的身高来解释不同人的体重波动(变化)。如果人们的身高能够解释体重的这种变化,那么我们就有一个很好的模型。

方差是度量被用于此目的,因为它测量多远的一组数字被传播出去(从他们的平均值)的好。

这有助于我们重新表述最初的问题:一个人的体重多少可以用他/她的身高来解释?

这就是“解释的百分比差异”的来源。顺便说一下,对于回归分析,它等于相关系数R平方

对于上述模型,我们也许能够做出声明,如:利用回归分析,有可能通过建立预测模型的高度来解释一个人的方差的60%重量。”

现在,60%有多好?对此很难做出客观的判断。但是,如果您有其他竞争模型(例如,另一个使用人的年龄来预测自己体重的回归模型),则可以根据模型解释的差异来比较不同的模型,并确定哪种模型更好。(对此有一些警告,请参阅“解释和使用回归”-Christopher H. Achen http://www.sagepub.in/books/Book450/authors


1
这肯定回答了我大部分的问题。关于作者为什么这么说它具有巨大的意义,我不知道。因此,如果这是R值,我们再回到您的示例:说我们确实使用了“年龄”模型,其方差为80%,然后,使用了“身高”模型,方差为85 %可以预测一个人的体重,我认为后者模型会更有意义吗?感谢您的图书链接,我昨晚购买了它,因为在接下来的几个月中我将大量使用回归。
user1574598 '16

1
是的,您可以得出结论,后一种模型在预测(或解释)某人体重的能力方面更好。顺便说一句,您说这是“模型的差异为80%”,但应为“模型解释了80%的差异”。
Vishal

4

作者指的是由公式给出的模型的值R2

i=1n(y^iy¯)2i=1n(yiy¯)2

其中是观测值,是数据点的最小二乘拟合值,而是整体平均值。由于总平方分解,我们有时将视为模型解释的变化比例yiy^iithy¯R2

i=1n(yiy¯)2=i=1n(y^iy¯)2+i=1n(yiy^i)2,

后一项是模型未考虑的残余误差。在基本上告诉我们多少的整体变化已经被“吸收”的拟合值。R2

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.