推荐的书籍或文章作为聚类分析的简介?


12

我正在研究一个小的(200M)文本语料库,我想通过一些聚类分析来探索它。您会推荐有关该主题的哪些书籍或文章?

Answers:


6

也许值得看一下MW Berry的书:

  1. 文本挖掘调查I:聚类,分类和检索(2003)
  2. 文本挖掘调查II:聚类,分类和检索(2008)

它们由一系列应用和评论论文组成。最新版本似乎可以在以下地址以PDF格式获得:http : //bit.ly/deNeiy

以下是一些与CA相关的链接,可应用于文本挖掘:

您也可以查看“ 潜在语义分析”,但在那里看到我的回答:解决聚类问题


5

在数据中查找组。Leonard Kaufman和Peter J. Rousseeuw教授的聚类分析简介

我正在阅读这本书,发现它非常有用,因为:

  • 正如作者在序言中所述:

我们的目的是为普通用户编写一本实用的书。我们希望对不一定具有强大数学或统计背景的人们提供聚类分析。

  • 它提供了理论上的内容,以了解R程序包Cluster中可用的功能。

  • 可以根据感兴趣的群集方法单独阅读章节。
    第3章是例外,它建立在第2章的基础上

这本书的章节是:

  1. 介绍
  2. 围绕类固醇分区(程序PAM)。
  3. 群集大型应用程序(程序CLARA)。
  4. 模糊分析(程序FUNNY)。
  5. 集聚嵌套(程序AGNES)。
  6. 分歧分析(计划DIANA)。
  7. 一元分析(MONA程序)。

参考文献:

Kaufman,L.和Rousseeuw,PJ(2005)。在数据中查找组。聚类分析简介(第342页)。约翰·威利父子公司

Maechler,M.(2013年)。聚类分析扩展Rousseeuw等。CRAN。


1
这本书的确为该领域提供了很好的概述。它着重于一些算法/方法(例如,众所周知的轮廓,恰巧是本书的一位作者设计的),并广泛地涵盖了它们。它还带有一些代码,但具有1990风格。仅供参考:完整目录
Franck Dernoncourt 2013年


2

Brian S. Everitt撰写的《聚类分析》是一本很好的书本式聚类分析应用书。



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.