我正在阅读Hinton的新论文“胶囊之间的动态路由”,但没有抽象地理解术语“活动向量”。
胶囊是一组神经元,其活动矢量代表特定类型的实体(例如对象或对象部分)的实例化参数。我们使用活动矢量的长度来表示实体存在的概率,并使用其方向来表示实例化参数。一级的活动胶囊通过转换矩阵对高层胶囊的实例化参数进行预测。当多个预测结果一致时,更高级别的胶囊就会生效。我们表明,经过判别训练的多层胶囊系统在MNIST上达到了最先进的性能,并且在识别高度重叠的数字方面比卷积网络要好得多。为了获得这些结果,我们使用了一种按协议迭代路由的机制:
https://arxiv.org/pdf/1710.09829.pdf
我认为向量就像是您通过网络运行的数据数组。
我开始学习安德鲁·伍(Andrew Ng)的深度学习课程,但它是全新的,术语令我头疼。