我想从仅包含布尔值的向量数据集中构建分类器。如果在学习之前添加包含原始特征组合(使用逻辑运算符« OR »和« AND »)的特征,我的分类器是否有可能表现更好,或者那将毫无意义?
例如,我有以下数据集:
feature A feature B feature C
vector 1 True False True
vector 2 True True False
vector 3 False True True
想象一下,我有这样的感觉,即数据对特征 C 和特征 D 都为 True 的事实通常会使它进入一个特定的类别。在学习构建分类器的数据之前,我是否应该向每个向量添加由逻辑运算 « 特征 B AND 特征 C » 计算的额外特征:
feature A feature B feature C feature D
vector 1 True False True False
vector 2 True True False False
vector 3 False True True True
或者分类器是否会考虑“特征 B 和特征 C”的相关性?它是否取决于算法(svm、Knn 等)?