5
为什么成本函数使用平方误差?
我刚刚开始进行一些机器学习,直到现在我一直在处理一个变量的线性回归。 我了解到有一个假设,即: hθ(x)=θ0+θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x 要了解好值的参数和θ 1,我们希望尽量减少计算结果和我们的测试数据的实际结果之间的差别。所以我们减去θ0θ0\theta_0θ1θ1\theta_1 hθ(x(i))−y(i)hθ(x(i))−y(i)h_\theta(x^{(i)})-y^{(i)} 从1到m的所有。因此,我们计算该差的总和,然后将总和乘以1来计算平均值iii111mmm。到现在为止还挺好。这将导致:1m1m\frac{1}{m} 1m∑mi=1hθ(x(i))−y(i)1m∑i=1mhθ(x(i))−y(i)\frac{1}{m}\sum_{i=1}^mh_\theta(x^{(i)})-y^{(i)} 但这不是建议。相反,该课程建议采用差的平方值,然后乘以。因此公式为:12m12m\frac{1}{2m} 12m∑mi=1(hθ(x(i))−y(i))212m∑i=1m(hθ(x(i))−y(i))2\frac{1}{2m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2 这是为什么?为什么在这里使用平方函数,为什么要乘以而不是112m12m\frac{1}{2m}?1m1m\frac{1}{m}