Questions tagged «gradient-descent»

2
在神经网络中,均方误差是否总是凸出的?
我提到的多种资源都提到MSE很棒,因为它是凸的。但是我不知道怎么做,尤其是在神经网络的情况下。 假设我们有以下内容: XXX:训练数据集 YYY:目标 ΘΘ\Theta:模型(具有非线性的神经网络模型)的参数集fΘfΘf_\Theta 然后: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 为什么这个损失函数总是凸的?这是否取决于?FΘ(X)fΘ(X)f_\Theta(X)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.