为每个离散变量的每个值创建一个布尔值会增加特征的数量。我有一个解决它的想法,但我无法在互联网上找到任何东西,所以也许有人可以向我指出资源或让我知道他们是否认为这是可能的。如果不是,也许指向另一个解决方案(我能找到的只是二值化)。
所以如果我们有训练向量和类似的标签, 我建议我们通过一些变量来划分训练集, 这样对于每个为此等于某个值,将在.
那么对于每个我们计算平均值为了并对这些平均值进行排序,映射每个到它在排序列表中的索引上。该值用作特征. 我怀疑这应该比仅仅给每个值一个随机索引更好,因为任何剩余的非线性都有望被隐藏层修复。但是,如果函数有点准单调,这些非线性模式似乎会更容易理解。
我认为这可以改进,可能不仅仅是找到平均值,另一种测量方法可以更好地工作,并且对于多个离散特征也可以,我不确定是否应该单独为每个变量重复这个过程,或者通过多维分区。
主要问题当然是,这个过程是否有帮助,如果没有,是否有类似的东西可以解决这个问题?