Questions tagged «ward»

3
如果不是Ward的标准,hclust()中的ward.D将执行哪种算法?
选项“ ward.D”(相当于R版本<= 3.0.3中唯一的Ward选项“ ward”)使用的选项不实现Ward(1963)的聚类标准,而选项“ ward.D2”实现该标准( Murtagh and Legendre 2014)。 (http://stat.ethz.ch/R-manual/R-patched/library/stats/html/hclust.html) 显然,ward.D未能正确执行Ward的标准。尽管如此,它似乎在产生的聚类方面做得很好。如果不是Ward的标准,method =“ ward.D”会实现什么? 参考文献 Murtagh,F.,&Legendre,P.(2014年)。沃德的层次聚类聚类方法:哪些算法实现沃德准则?分类杂志,31(3),274-295。
16 r  clustering  ward 

3
将曼哈顿距离与Ward的集群间链接一起使用可以进行分层集群吗?
我正在使用层次聚类分析时间序列数据。我的代码是使用Mathematica实现的函数DirectAgglomerate[...],该函数根据以下输入生成层次聚类: 距离矩阵D 用于确定集群间链接的方法的名称。 我已经使用曼哈顿距离计算了距离矩阵D: d(x,y)=∑i|xi−yi|d(x,y)=∑i|xi−yi|d(x,y) = \sum_i|x_i - y_i| 其中和Ñ ≈ 150是数据点在我的时间序列数。i=1,⋯,ni=1,⋯,ni = 1,\cdots, nn≈150n≈150n \approx 150 我的问题是,可以将Ward的集群间链接与曼哈顿距离矩阵一起使用吗?一些资料表明,沃德的连接只能与欧几里得距离一起使用。 请注意,DirectAgglomerate[...]仅使用距离矩阵而不是原始观测值来计算Ward的链接。不幸的是,我不确定Mathematica是如何修改Ward的原始算法的(根据我的理解),该算法通过最小化相对于聚类均值计算的观测值平方误差之和而起作用。例如,对于由单变量观测值向量组成的聚类,Ward将平方的误差平方和表示为:ccc (∑j||cj−mean(c)||2)2(∑j||cj−mean(c)||2)2(\sum_j||c_j - mean(c)||_2)^2 (其他软件工具(例如Matlab和R)也仅使用距离矩阵来实现Ward的聚类,因此问题并非特定于Mathematica。)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.