Answers:
基本上有四种方法:
存在各种各样的方法。它们可以大致分为随机/无向搜索方法(例如网格搜索或随机搜索)和直接方法。但是请注意,除非您很幸运,否则它们都需要测试大量的超参数设置(至少数百个,取决于参数的数量)。
在直接方法类中,可以确定几种不同的方法:
您可能需要研究Optunity,这是一个Python软件包,其中提供了用于超参数调整的各种求解器(到目前为止,我提到的所有内容都包括EGO和Kriging)。机会很快将适用于MATLAB和R。免责声明:我是该软件包的主要开发人员。
根据我的个人经验,进化方法对于这些类型的问题非常有效。
别再看了!Yoshua Bengio发表了我最喜欢的应用论文之一,当所有新的机器学习工程师开始训练神经网络时,我都推荐给他们:针对基于梯度的深度架构训练的实用建议。要获得他对超参数转向的看法:包括学习率,学习率时间表,提前停止,最小批量大小,隐藏层数等,请参阅第3节。