我的数据集包含许多数字属性和一个分类属性。
说NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr
,,
其中CategoricalAttr
取三个可能值之一CategoricalAttrValue1
:CategoricalAttrValue2
或CategoricalAttrValue3
。
我正在为 Octave 使用默认的 k-means 聚类算法实现。它仅适用于数字数据。
所以我的问题是:将分类属性拆分CategoricalAttr
为三个数字(二进制)变量是否正确,例如IsCategoricalAttrValue1, IsCategoricalAttrValue2, IsCategoricalAttrValue3
?