编码与依赖类别相关的 ML 分类特征

数据挖掘 机器学习 特征工程 一热编码
2022-03-06 14:52:06

我有一个 A、B 和 C 三个类别的分类问题。

我有代表我的数据项的特征 x1、x2 和 x3。但我还有第四个特征,它表示我的数据项与 A、B 和 C 中的每一项之间的相似性。

我的问题是,鉴于它与 A、B 和 C 中的每一个相关,如何对这种相似性特征进行编码。

我的猜测是具有三个相似特征 sA、sB 和 sC。一个热编码风格的每个类别。所以我得到的特征是:

x1、x2、x3、sA、sB、sC

问题:

  • 这种方法有任何问题吗?
  • 有替代方案吗?
  • 这种编码有名称吗?
0个回答
没有发现任何回复~