我对机器学习方法很陌生。我正在阅读使用随机森林构建预测模型的教程。实现的转换之一是将分类变量转换为二进制。想象一下(短样本):
Field_Desc Field_Value
A 32
A 100
B 1
然后开发人员将此数据集传递到:
Field_A1 Field_B1 Field_Value
1 0 32
1 0 100
0 1 1
对随机森林预测进行这种转换有什么好处?而对于 K-Means 会有什么优势吗?
谢谢!