给定两个线性回归模型,哪种模型效果更好?


14

我在学院上过机器学习课程。在其中一项测验中,有人问了这个问题。

模型1:

y=θx+ϵ
模型2:
y=θx+θ2x+ϵ

以上哪个模型更适合数据?(假设数据可以使用线性回归建模)

正确的答案(根据教授)是,两个模型的性能都一样好。但是我相信第一个模型会更合适。

这就是我回答背后的原因。第二个模型,其可以被重写为α = θ + θ 2将不一样的第一模型。α事实上是一个抛物线,因此具有一个最小值(- 0.25在这种情况下)。因此,第一模型中的θ的范围大于第二模型中的α的范围。因此,如果数据是这样的,最适合的有坡度小于- 0.25,所述第二模式将非常差相比于第一个作为执行。但是,如果最佳拟合的斜率大于αx+ϵα=θ+θ2α0.25θα0.25,两个模型的性能相同。0.25

那么第一个比较好,还是两者完全一样?


3
我认为你是对的。要求的参数是表达为θ + θ 2(对于某些θ)确实执行什么约束α的是可能的。这意味着,第二模型可以表达比第一关系,因为它本质上是现在约束的优化问题。您的推理对我来说似乎很扎实。αθ+θ2θα
马修·德鲁里

@MatthewDrury我只是想知道我出了什么问题,请看下面的答案(和评论)
库什

3
我看到你的评论,但这是一些相当严肃的体操,假设将采用复杂的值。我一定会参加一些办公时间,与您的教授讨论这个问题。无论哪种方式,您都会得到很好的讨论。θ
马修·德鲁里

1
我不清楚-0.25的来源。你能澄清一下吗?
疯狂杰克

1
我会对您的教授如何将每个模型拟合到两点数据集感兴趣。在模型1和θ = 1的情况下,拟合是理想的,但是他/她将如何估算模型2中的θ以获得理想的拟合?{(1,1),(2,2)}θ=1θ
ub

Answers:


9

模型2可以写为: 这似乎与模型1类似,只是超参数(θ β)的符号不同。然而,对于模型1,我们可以写出θ = X

y=(θ+θ2)x+ϵ=βx+ϵ.
θ,β
θ^=(XX)1Xy.

但是,由于在模型2中,我们有 然后当你确实提到的范围β应该属于[ - 0.25 + ]对于θ ∈ [R 。这将导致这两个模型的差异。

β=θ+θ2,
β^[0.25,+]θR

因此,在模型2您约束您的系数估计不像模型1.为了使这更清楚,但应注意的是,在模型1中是通过最小化平方损失得到 θ = ARG 分钟θ ∈ [R ÿ - X θ θ^ 然而,在模型2中的估计是通过获得 β =ARG分钟β - 0.25Ý-Xβ

θ^=argminθR  (yXθ)(yXθ)=(XX)1Xy.
这可能会导致不同的结果。
β^=argminβ0.25  (yXβ)(yXβ)

1
θθ+θ2θ

@kush请检查我编辑过的回复,该回复也可以解决您的问题
2016年

1

不确定我是否理解您的理由。如果您采取:

y=αx+ϵ
y=θx+ϵ

αθαθR2θα=θ+θ2


5
θ(,)α(0.25,)x
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.