人工智能 gradient-descent

在神经网络中，均方误差是否总是凸出的？

我提到的多种资源都提到MSE很棒，因为它是凸的。但是我不知道怎么做，尤其是在神经网络的情况下。假设我们有以下内容： XXX：训练数据集 YYY：目标 ΘΘ\Theta：模型（具有非线性的神经网络模型）的参数集fΘfΘf_\Theta 然后： MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 为什么这个损失函数总是凸的？这是否取决于？FΘ（X）fΘ(X)f_\Theta(X)

9 neural-networks math backpropagation gradient-descent

Questions tagged «gradient-descent»