我正在尝试通过CS224D斯坦福大学在线课程材料的第一个问题集解决问题,而我对问题3A遇到一些问题:当使用带有softmax预测函数和交叉熵损失函数的跳过语法word2vec模型时,我们想要计算相对于预测单词向量的梯度。所以给定softmax函数:
和交叉熵函数:
我们需要计算
我的步骤如下:
现在给定是一个热向量,而我是正确的类:
这是正确的还是可以进一步简化?我想尝试确保自己走在正确的轨道上,因为问题集解决方案未在线发布。另外,正确完成书面作业对正确完成编程作业很重要。
请在问题中添加自学标记
—
Dawny33
第一个日志标识的第二个减号应为加号。试图为您修复它,但编辑内容至少应为6个字符:\
—
FatalMojo 2015年