因此,我才刚刚开始学习神经网络如何操作以识别模式并对输入进行分类,并且我已经看到了人工神经网络如何解析图像数据并对图像进行分类(使用convnetjs进行演示),以及其中的关键将对图像进行降采样,每个像素将一个输入神经元刺激到网络中。
但是,我是否想用字符串输入来解决问题?我得到的用例是用户观看过的电影的“推荐引擎”。电影有很多字符串数据(标题,情节,标签),我可以想象将文本“缩减采样”到描述该电影的几个关键词,但是即使我解析出描述该电影的前五个词,认为我需要每个英语单词都需要输入神经元才能比较一组电影吗?我可以将输入神经元限制为仅用于集合中的单词,但是随后它可以通过添加新电影(用户以新词观看新电影)来成长/学习吗?我见过的大多数库都不允许在训练系统后添加新的神经元?
是否存在将字符串/单词/字符数据映射到神经网络输入的标准方法?还是神经网络真的不是像这样解析字符串数据的正确工具(哪种是更好的字符串数据模式匹配工具?)?