隐马尔可夫模型是哪种机器学习算法?


12

我在信号处理课程中使用了隐马尔可夫模型算法进行自动语音识别。现在遍历机器学习文献,我看到算法被分类为“分类”,“聚类”或“回归”。HMM属于哪个存储桶?我没有遇到文献中列出的隐藏马尔可夫模型。

Answers:


14

我很想回答“无”或“分类和聚类”。

为什么“没有”?因为HMM与支持向量机或k均值不在同一个包中。

支持向量机或k均值是专门为解决问题而设计的(在第一种情况下为分类,在第二种情况下为聚类),并且实际上只是一种优化过程,可最大化“预期的分类优度”或“聚类的优度”标准。美在于标准的选择和优化程序。HMM本身不是算法。它们是向量序列上的一种特定概率分布-我们知道良好的参数估计和边际分布计算算法。但是,问他们是否属于“集群”或“分类”家族,与问高斯分布是监督学习还是无监督学习一样荒谬。

为什么要“分类和聚类”?由于以下原因:作为概率分布,HMM可用于贝叶斯框架中的分类;并且由于模型具有隐藏状态,因此可以从其参数中恢复训练数据的一些潜在聚类。更确切地说:

HMM可用于分类。这是贝叶斯分类框架的直接应用,HMM用作描述数据的概率模型。例如,您有一个大型的数字话语数据库(“一个”,“两个”等),并且想要构建一个能够对未知话语进行分类的系统。对于训练数据中的每个班级(“一个”,“两个”),您估计描述该班级训练序列的HMM模型的参数-最终得到10个模型。然后,要进行识别,请计算10个模型在HMMRabiner教程中,可能性得分(指示您希望识别的序列由模型生成的可能性),得分最高的模型将为您提供数字。,训练阶段为“问题3”,分类阶段为“问题2”。

kγkk


1

首先,让我们看一下三个选项:

  • 分类:标识数据属于一组预定义类中的哪个类。
  • 聚类:学习数据所属的一组类。
  • 回归:找到on变量与一个或多个其他变量之间的关系。

Wikipedia上的HMM描述如下表:

在此处输入图片说明

因此状态(类)的数量是固定的。

这意味着该算法不会尝试找出类的数量(状态),因此它不是开放式聚类(状态数量未知)。

但是,正如@nikie指出的那样,HMM将进行群集。

实际上并没有自变量(就像在回归上下文中一样)---所以它不是回归。

所以我的答案是HMM是分类聚类算法,我不认为这是回归。


2
您如何从“如果固定的类数”到“因此算法不会尝试找出这些类是”的话?k均值聚类的类数也是固定的,但这显然是一种聚类算法。
Niki Estner 2012年

我想我习惯了开放式集群,而不是固定的。将更新答案。谢谢!
彼得·K。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.