高尔距离如何计算二进制变量之间的差异?


13

我有17个数字变量和5个二进制(0-1)变量,数据集中有73个样本。我需要进行聚类分析。我知道,高尔距离对于具有混合变量的数据集是一个很好的指标。但是,我无法理解高尔距离如何计算二进制变量之间的差。在我看来,它与欧几里得距离没有什么不同。


您的问题不太清楚。您是否只是在问“高尔距离如何计算二进制变量之间的差”?“没有什么比欧几里得不同”的意思了?
gung-恢复莫妮卡

1
谢谢。抱歉,我问高尔如何计算二进制变量之间的差。我的意思是,我无法理解两者之间的差异。欧几里得和高尔的二元变量。
EmrahBilgiç14年

您在此网站上搜索过Gower吗?stats.stackexchange.com/a/15313/3277
ttnphns 2014年

是的,我做到了。如果两个样本的值相同,则欧氏距离为0,否则为1。那高尔呢?
EmrahBilgiç14年

4
@EmrahBilgiç,高尔度量标准是相似性,而不是距离。当从1中减去时,它变成“距离”。在上面的链接下阅读其如何处理二进制数据。
ttnphns 2014年

Answers:


5

对于“ male”和“ female”,具有值“ m”和“ f”的二进制属性怎么样?

你一定要明白,对于一个dicotomous变量可以全身而退是“相同”或“不同”?如果值为1或0,则距离之间的关键点差不是;否则,为0。但是如何将多个变量组合在一起。


3

高尔距离使用Manhattan来计算连续数据点之间的距离,并使用Dice来计算分类数据点之间的距离

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.