(为什么)Kohonen风格的SOM失宠了?


33

据我所知,Kohonen风格的SOM早在2005年就达到了顶峰,最近并未受到太大的欢迎。我还没有发现任何文章说SOM被另一种方法包含,或被证明等同于其他方法(无论如何,在更大的维度上)。但是,看起来tSNE和其他方法如今越来越多了,例如在Wikipedia或SciKit Learn中,SOM被更多地称为历史方法。

(实际上,维基百科的文章似乎表明SOM仍比竞争对手具有某些优势,但它也是列表中最短的条目。编辑:Per gung的要求,我正在考虑的文章之一是:非线性降维请注意,与其他方法相比,SOM的文字更少。我找不到找到提到SOM似乎比大多数其他方法都具有优势的文章。)

有什么见解吗?有人问为什么不使用SOM,并在不久前得到了参考,我从SOM会议中找到了议事日程,但我想知道SVM或tSNE等的兴起是否使SOM在流行机器学习中黯然失色。

编辑2:纯属巧合,我今天晚上只读了2008年关于非线性降维的调查,仅举例说明了:Isomap(2000),局部线性嵌入(LLE)(2000),Hessian LLE(2003),Laplacian本征图(2003)和半定嵌入(SDE)(2004)。


3
您可以链接到您所引用的任何资源吗?(例如,哪个Wikipedia文章“似乎表明...”?)
gung-恢复莫妮卡

11
他们似乎在某种程度上失宠了,我不知道SOM指的是什么。
马修·德鲁里

5
显然,这是自组织的地图
Christoph Hanck,2015年

SOM只是多维缩放(MDS)的一种变体,它比以前要古老得多。
kjetil b halvorsen

@kjetilbhalvorsen:您是否有关于SOM和MDS的参考?据我了解,MDS本质上是全球性的(与PCA相关),而SOM本质上是本地性的。也许我误会了他们。
韦恩

Answers:


18

我认为您注意到了机器学习目前所吹捧的降维“最佳”算法的影响。尽管t-SNE在诸如Merck Viz Challenge之类的竞赛中显示了其功效,但我个人还是成功地将SOM应用于特征提取和二进制分类。尽管除了算法的使用期限外,当然还有一些人无缘无故地驳回SOM(请查看此讨论,但在过去几年中,也有许多文章发表了实现SOM并取得积极成果的文章(请参阅Mortazavi等人, 2013 ; Frenkel等人,2013例如)。Google Scholar搜索将显示SOM在许多应用程序域中仍在使用。但是,通常来说,针对特定任务的最佳算法就是针对特定任务的最佳算法。在随机森林可能对某个特定的二进制分类任务运行良好的情况下,它可能会在另一个森林上表现糟糕。聚类,回归和优化任务也是如此。这种现象与“ 免费午餐定理”有关,但这是另一个讨论的主题。总而言之,如果SOM最适合您在特定任务上的工作,那么不管流行什么,SOM都是您应使用的算法。


5

我已经完成了将SOM与t-SNE进行比较的研究,并且提出了SOM的改进,使其达到了新的效率水平。请在这里查看,让我知道您的反馈。很想了解人们对此的想法,以及是否值得在python中发布供人们使用。

IEEE的论文链接:http : //ieeexplore.ieee.org/document/6178802/

Matlab实现。 https://www.mathworks.com/matlabcentral/fileexchange/35538​​-cluster-reinforcement--cr--phase

感谢您的反馈意见。


4
欢迎使用交叉验证!简要概述您的发现以及所做的改进,也可能有助于更直接地解决该问题。
Scortchi-恢复莫妮卡

1

我的主观观点是,与许多其他方法相比,SOM的知名度和知名度都不如“性感”,但与某些类型的问题仍然高度相关。如果它们被更广泛地使用,它们很可能会做出重大贡献。在探索性数据科学的早期阶段,它们对于获得多元数据的“景观”或“拓扑”具有不可估量的价值。

库等的发展Somoclu,并研究如由GuénaëlCabanes的(以及许多其他)显示的SOM仍然适用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.