科学家如何提出使用正确的隐马尔可夫模型参数和拓扑?


10

我了解如何在基因组序列(例如寻找基因)中使用隐马尔可夫模型。但是我不明白如何提出一个特定的马尔可夫模型。我的意思是,模型应具有多少个状态?有多少种可能的过渡?模型应该有一个循环吗?

他们怎么知道他们的模型是最优的?

他们是否想像出10种不同的模型,对这10种模型进行基准测试并发布最佳模型?

Answers:


6

我熟悉三种主要方法:

  1. 先验。您可能知道有四个碱基对可供选择,因此允许HMM具有四个状态。或者,您可能知道英语有44个音素,因此语音识别模型中隐藏的音素层也有44个状态。

  2. 估算。通常可以通过对HMM观察到的特征进行简单聚类来预先估计状态数。如果HMM转换矩阵是三角形的(在故障预测中通常是这种情况),则状态数确定从开始状态到结束状态的总时间分布的形状。

  3. 优化。就像您建议的那样,创建或拟合了许多模型,并选择了最佳模型。还可以采用学习HMM的方法,以允许模型根据需要添加或丢弃状态。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.