Answers:
在LSTM中选择隐藏层的数量和存储单元的数量始终取决于要应用此LSTM的应用程序域和上下文。
对于隐藏的图层。隐藏层的引入使得网络有可能表现出非线性行为。
隐藏单元的最佳数量可以轻易地小于输入数量,没有规则像将输入数量乘以N ...如果您有很多训练示例,则可以使用多个隐藏单元,但是有时2个隐藏单元最适合使用少量数据。通常,人们使用一个隐藏层来完成简单的任务,但是如今,在深度神经网络体系结构中的研究表明,许多隐藏层对于困难的对象,手写字符和面部识别问题可能是富有成果的。
I assume it totally depends on the application and in which context the model is being used.
通常,没有关于如何确定LSTM中的层数或存储单元数的准则。
LSTM中所需的层和单元的数量可能取决于问题的几个方面:
数据集的复杂性。特征数量,数据点数量等
数据生成过程。以下示例说明数据生成过程如何发挥重要作用。
前-与公认的经济体的GDP预测相比,石油价格的预测。后者比前者容易得多。因此,与国内生产总值相比,预测油价可能还需要更多数量的LSTM存储单元才能以相同的准确性进行预测。
使用LSTM建模时,请遵循以下步骤:
尝试使用2个或3个存储单元的单个隐藏层。查看它在基准测试中的表现。如果这是一个时间序列问题,那么我通常会以古典时间序列技术为基准进行预测。
尝试增加存储单元的数量。如果性能没有太大提高,请继续执行下一步。
开始使网络更深,即添加具有少量存储单元的另一层。
在旁边 :
对达到损失函数的全局最小值并调整最佳超参数的工作量没有限制。因此,将重点放在建模的最终目标上应该是策略,而不是试图尽可能地提高准确性。
大多数问题可以使用2-3层网络来解决。
也许您应该看看以下内容:https : //wiki.inf.ed.ac.uk/twiki/pub/CSTR/ListenTerm1201415/sak2.pdf
在这里,他们表明2层很好,5层更好,7层很难训练。