我有一个 A、B 和 C 三个类别的分类问题。
我有代表我的数据项的特征 x1、x2 和 x3。但我还有第四个特征,它表示我的数据项与 A、B 和 C 中的每一项之间的相似性。
我的问题是,鉴于它与 A、B 和 C 中的每一个相关,如何对这种相似性特征进行编码。
我的猜测是具有三个相似特征 sA、sB 和 sC。一个热编码风格的每个类别。所以我得到的特征是:
x1、x2、x3、sA、sB、sC
问题:
- 这种方法有任何问题吗?
- 有替代方案吗?
- 这种编码有名称吗?
我有一个 A、B 和 C 三个类别的分类问题。
我有代表我的数据项的特征 x1、x2 和 x3。但我还有第四个特征,它表示我的数据项与 A、B 和 C 中的每一项之间的相似性。
我的问题是,鉴于它与 A、B 和 C 中的每一个相关,如何对这种相似性特征进行编码。
我的猜测是具有三个相似特征 sA、sB 和 sC。一个热编码风格的每个类别。所以我得到的特征是:
x1、x2、x3、sA、sB、sC
问题: