我的数据集包含许多数字属性和一个类别。
说NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr
,
其中CategoricalAttr
采用的三个可能的值之一:CategoricalAttrValue1
,CategoricalAttrValue2
或CategoricalAttrValue3
。
我正在为Octave使用默认的k-means聚类算法实现https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/。它仅适用于数字数据。
所以我的问题是:将类别属性拆分CategoricalAttr
为三个数字(二进制)变量是否正确IsCategoricalAttrValue1, IsCategoricalAttrValue2, IsCategoricalAttrValue3
?