Answers:
我强烈建议不要在此处使用k-means。k的不同值的结果不能很好地比较。该方法只是一种粗略的启发式方法。如果您确实要使用群集,请使用EM群集,因为您的数据似乎包含正态分布。并验证您的结果!
相反,一种明显的方法是尝试拟合单个高斯函数,并(例如使用Levenberg-Marquard方法)拟合三个高斯函数,可能将其约束到相同的高度(以避免退化)。
然后测试,两个分布中的哪一个更合适。
使用K均值聚类算法来识别各种方法
在R-seek中寻找功能KNN以找到适当的功能
kmeans
功能。尝试之间的结果差异很大。(此实现中的启发式方法不好吗?)对于1集群集,我的平均数有时约为(270,293,693),有时约为(260,285,308)。对于三簇集,一些答案是(196,324,468,)和(290,459,478)。