12 使用“变分”是否总是指通过变分推理进行优化? 例子: “可变自动编码器” “变分贝叶斯方法” “变数归一化组” machine-learning optimization inference — conner.xyz source 为了了解VAE,您还可以在此处和此处参考漂亮的youtube视频。他们回答了我对该主题的所有疑问。 — 安德烈·
9 这意味着使用变分推理(至少对于前两个而言)。 简而言之,当概率密度复杂(因此MLE很难)时,这是一种近似最大似然的方法。 它使用证据下界(ELBO)作为ML的代理: 升Ò 克(p (X ))≥ Èq[ 升Ò 克(p ,ž)] - Eq[ 升Ò 克(q(Z))]升ØG(p(X))≥Ëq[升ØG(p,ž)]-Ëq[升ØG(q(ž))] qqžž qq David Blei提供了一个很好的有关变分推理的教程,您可以查看是否需要更具体的描述。 编辑: ķ大号(q,p )ķ大号(q,p) — 雅库布·巴特祖克(Jakub Bartczuk) source