使用哪种算法来匹配具有 n 维的两个类别

数据挖掘 机器学习 分类 数据挖掘
2022-03-05 09:42:11

假设我有两个类别的示例,产品和通道。

每个产品都有价格、重量、水分等级等变量,然后过道有它可以处理的最大重量、附近的水分等变量。

现在我想运行一些算法,根据产品和过道变量对哪些产品应该进入哪些过道进行分类。

例如,如果产品 A 的重量为 10 公斤,它可以承受的水分为 x,它应该去可以承受该重量并具有该水分等级的 Aisle。

如果我在产品和通道之间有相同的变量,我该如何解决我的问题?

1个回答

没有通用算法来匹配维度不同且属性也可能不同的两类数据。但是,您可以将数据转换为类似的维度。我建议您的一种方法是对这两个数据进行 PCA。采用 PCA 后,您可以选择两个数据的前 k 个主成分,使它们成为具有相似属性的几乎相同的数据。然后,您可以在 Aisles 的转换数据上使用 k-最近邻来训练您的模型。该模型可以很容易地用于测试产品的转换数据。