在Goodfellow(2016)的一本关于深度学习的书中,他谈到了尽早停止与L2正则化的等效性(https://www.deeplearningbook.org/contents/regularization.html第247页)。
成本函数二次逼近由下式给出:
其中是Hessian矩阵(方程7.33)。这是缺少中期吗?泰勒展开应该是:
在Goodfellow(2016)的一本关于深度学习的书中,他谈到了尽早停止与L2正则化的等效性(https://www.deeplearningbook.org/contents/regularization.html第247页)。
成本函数二次逼近由下式给出:
其中是Hessian矩阵(方程7.33)。这是缺少中期吗?泰勒展开应该是:
Answers:
他们谈论最佳权重:
我们可以在权重的经验最优值附近以二次逼近对成本函数建模
在这一点上,一阶导数为零,因此省略了中间项。