Questions tagged «self-organizing-maps»

2
人工神经网络ANN如何用于无监督聚类?
我了解如何artificial neural network (ANN)使用反向传播以监督方式训练,以通过减少预测误差来改善拟合。我听说ANN可以用于无监督学习,但是如何在没有某种成本函数来指导优化阶段的情况下做到这一点呢?使用k-means或EM算法时,有一个函数,每次迭代搜索都在增加该函数。 我们如何使用ANN进行聚类,以及它使用什么机制对同一地点的数据点进行分组? (以及增加更多层带来了哪些额外的功能?)

3
(为什么)Kohonen风格的SOM失宠了?
据我所知,Kohonen风格的SOM早在2005年就达到了顶峰,最近并未受到太大的欢迎。我还没有发现任何文章说SOM被另一种方法包含,或被证明等同于其他方法(无论如何,在更大的维度上)。但是,看起来tSNE和其他方法如今越来越多了,例如在Wikipedia或SciKit Learn中,SOM被更多地称为历史方法。 (实际上,维基百科的文章似乎表明SOM仍比竞争对手具有某些优势,但它也是列表中最短的条目。编辑:Per gung的要求,我正在考虑的文章之一是:非线性降维请注意,与其他方法相比,SOM的文字更少。我找不到找到提到SOM似乎比大多数其他方法都具有优势的文章。) 有什么见解吗?有人问为什么不使用SOM,并在不久前得到了参考,我从SOM会议中找到了议事日程,但我想知道SVM或tSNE等的兴起是否使SOM在流行机器学习中黯然失色。 编辑2:纯属巧合,我今天晚上只读了2008年关于非线性降维的调查,仅举例说明了:Isomap(2000),局部线性嵌入(LLE)(2000),Hessian LLE(2003),Laplacian本征图(2003)和半定嵌入(SDE)(2004)。

4
为什么混合数据是基于欧几里得的聚类算法的问题?
大多数经典的聚类和降维算法(分层聚类,主成分分析,k均值,自组织映射...)都是专门为数字数据设计的,其输入数据被视为欧氏空间中的点。 当然,这是一个问题,因为许多现实世界中的问题都涉及到混杂的数据:例如,如果我们研究公交车,则高度,长度和电机尺寸将是数字,但我们可能也会对颜色感兴趣(分类变量:蓝色/红色/绿色...)和容量类别(顺序变量:小/中/大容量)。具体来说,我们可能想同时研究这些不同类型的变量。 有很多方法可以将经典聚类算法扩展到混合数据,例如使用Gower不相似性插入层次聚类或多维缩放,或者采用其他以距离矩阵为输入的方法。或例如此方法,是将SOM扩展为混合数据。 我的问题是:为什么我们不能仅对混合变量使用欧几里德距离?还是为什么这样做不好?为什么我们不能仅对分类变量进行虚拟编码,对所有变量进行归一化,以使它们在观察之间的距离上具有相似的权重,并在这些矩阵上运行常规算法? 这真的很容易,而且从未做过,所以我想这是非常错误的,但是有人可以告诉我为什么吗?和/或给我一些参考?谢谢

4
文本挖掘:如何通过人工智能将文本(例如新闻文章)聚类?
我为不同的任务建立了一些神经网络(MLP(完全连接),Elman(递归)),例如打Pong,对手写数字和东西进行分类... 另外,我尝试建立一些第一个卷积神经网络,例如用于对多位数的手写笔记进行分类,但是我是全新的分析和聚类文本的人,例如在图像识别/聚类任务中,人们可以依靠标准化输入,例如25x25大小的图像, RGB或灰度等...有很多预设定功能。 对于文本挖掘(例如新闻报道),您需要不断变化的输入大小(不同的单词,不同的句子,不同的文本长度等)。 如何利用人工智能(最好是神经网络/ SOM)实现一种现代的文本挖掘工具? 不幸的是,我无法找到简单的入门教程。复杂的科学论文难以阅读,也不是学习主题的最佳选择(就我个人而言)。我已经阅读了很多有关MLP,辍学技术,卷积神经网络等的论文,但是我找不到关于文本挖掘的基础文章-对于我非常有限的文本挖掘技能来说,我发现的水平太高了。

5
针对名义/圆形变量的SOM聚类
只是想知道是否有人熟悉标称输入的聚类。我一直在将SOM作为解决方案,但显然它仅适用于数字功能。分类功能是否有扩展?我特别想知道“星期几”是否可能是功能。当然可以将其转换为数值特征(例如,周一至周日对应于1-7号),但是,周日与周一之间的欧几里得距离(1&7)将与周一至周二(1&2)之间的欧氏距离不同)。任何建议或想法将不胜感激。

1
如何自动将U-Matrix聚类?
训练完自组织图后,可以计算U-Matrix。有一些工具可以手动对其进行可视化并识别集群,但是我想知道是否有任何算法可以自动执行此过程(即,无需人工观察图形即可识别集群)。 有什么办法吗?我正在用R编写代码。在Internet上找不到任何类似的东西,因此也许有人可以在这里为我提供帮助。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.