Answers:
有许多出版物提出了选择这些参数的方法。
最著名的是OPTICS,它是一种DBSCAN变体,它消除了epsilon参数。它产生了一个分层结果,可以粗略地看成是“在所有可能的epsilon上运行DBSCAN”。
对于minPts,我建议不要依赖自动方法,而要依赖您的领域知识。
好的聚类算法具有参数,可让您根据需要对其进行自定义。
您忽略的参数是距离函数。DBSCAN要做的第一件事是为您的应用程序找到一个好的距离函数。不要依赖欧几里得距离是每种应用的最佳选择!
k
最近邻居分类相同时,则可以对minPts参数说相同。我猜主要的区别是距离,存在一个“通常”的明智默认值:欧几里得距离;而对于minPts,该值将取决于数据。