何时使用高斯混合模型?


9

我是使用GMM的新手。我无法在线找到任何适当的帮助。任何人都可以在“如何确定使用GMM是否适合我的问题?”方面为我提供正确的资源。或出现分类问题“如何决定是否必须使用SVM分类或GMM分类?”


您的数据集是什么?您的确切问题是什么?当数据遵循(混合)超过1个正态分布时使用。看到另一个问题- stats.stackexchange.com/questions/236295/...
Arpit西索迪亚

您可以将其视为没有标签数据并相信潜在分组完全是多元正态的聚类形式。
gung-恢复莫妮卡

@ arpit-sisodia,我们正在研究似乎具有特定功能的硬件键盘设置的可行性,并且我们计划使用GMM对其进行建模。我们不清楚底层过程,因此我们尝试使用机器学习方法进行建模。因此,我们不确定底层过程中是否确实存在高斯混合。此外,它是多维的,我们无法形象化地查看它是否是高斯混合体
Vinay

@ arpit-sisodia,您提供的链接建议了更多反复试验的方法,以查看GMM是否适合我的数据。是否有决定性的方式/经验法则来决定要使用的模型。尝试更多混合的试错法可以适合我的数据。但是,有某种确定的方法吗?就像我们需要对数据进行SVM分类的线性可分离性一样
Vinay

Answers:


4

我认为,如果您知道数据点是高斯分布的混合,则可以执行GMM。基本上形成均值和标准差不同的聚类。scikit-learn网站上有一个漂亮的图表。大号

GMM分类

一种方法是使用软聚类方法查找聚类,然后查看它们是否为高斯型。如果是,则可以应用代表整个数据集的GMM模型。


1
通常我们不知道数据点是否是高斯混合。因此,这更多地是与高斯和MoG的玩法,看看是否合适。但没有方向/拇指规则去使用权GMM
维奈

2
根据我的经验,您确实需要在数据中找到其混合模型的模式。一份不错的论文是:stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer

0

如果您的目标是(1)聚类观察,(2)指定生成模型或(3)估计密度,则GMM通常是一个不错的起点。实际上,对于聚类,GMM是k均值的超集

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.