10 我了解如何在基因组序列(例如寻找基因)中使用隐马尔可夫模型。但是我不明白如何提出一个特定的马尔可夫模型。我的意思是,模型应具有多少个状态?有多少种可能的过渡?模型应该有一个循环吗? 他们怎么知道他们的模型是最优的? 他们是否想像出10种不同的模型,对这10种模型进行基准测试并发布最佳模型? machine-learning model-selection hyperparameter markov — 你好,世界 source
6 我熟悉三种主要方法: 先验。您可能知道有四个碱基对可供选择,因此允许HMM具有四个状态。或者,您可能知道英语有44个音素,因此语音识别模型中隐藏的音素层也有44个状态。 估算。通常可以通过对HMM观察到的特征进行简单聚类来预先估计状态数。如果HMM转换矩阵是三角形的(在故障预测中通常是这种情况),则状态数确定从开始状态到结束状态的总时间分布的形状。 优化。就像您建议的那样,创建或拟合了许多模型,并选择了最佳模型。还可以采用学习HMM的方法,以允许模型根据需要添加或丢弃状态。 — 马修·格雷夫斯 source
1 另一种方法是从状态数量众多的模型中采样。然后,通过对采样器求平均值,得出“多少”的答案。 http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf — 猜想 source