我有一个包含混合变量的非常大的数据集。我已经将分类变量转换为数值使用OneHotEncoding
,它产生了超过几千种不同的特征,就是这样。
[[1. 0. 1. 0.]...[0. 0. 0. 0.]]
是否可以对看起来像或应该通过与原始数据集合并来完成的OneHotEncoded 数据应用降维算法?
我有一个包含混合变量的非常大的数据集。我已经将分类变量转换为数值使用OneHotEncoding
,它产生了超过几千种不同的特征,就是这样。
[[1. 0. 1. 0.]...[0. 0. 0. 0.]]
是否可以对看起来像或应该通过与原始数据集合并来完成的OneHotEncoded 数据应用降维算法?