多类/类别的方法?

人工智能 神经网络 卷积神经网络 分类
2021-11-03 16:22:04

我在开始处理具有多个功能的多类问题时遇到问题,希望有人能指出我正确的方向。

我有这样结构的数据用于训练:

Item State Code1 Code2 Code3 Route
---  ---   ---   ---   ---   ---
item1 MI   A1    33    blue  Route1
item2 TX   A3    35    yellow Route2
item3 NM   A4    36    green  Route3
item4 NM   A4    37    green  Route3

本质上,我试图弄清楚从哪里开始。目标是根据功能状态、代码 1、2 和 3 知道将项目路由到哪里。路由取决于代码和状态的混合,我想构建一个模型,说明当我有代码 X , Y, Z 和颜色 XX,那么它可能是路线 1(当然,训练数据中的某些路线可能有 X、Y 作为代码和不同的 Z)

我假设我需要对状态和代码等功能进行一次性编码?但是从那里有人知道我应该选择哪种类型的模型吗?我会假设某种神经网络,我已经探索了 CNN 和 Random Forrest。

3个回答

我的钱会花在更简单的东西上,比如朴素贝叶斯

根据我对小数据的经验,NB 优于更奇特的方法。

此外,如果您想从训练数据中获得更多价值,请尝试10 折交叉验证

如果您没有那么多训练数据,您可能可以使用更简单的模型,但是如果您有很多训练数据,我建议您采用这种方法:您将希望对状态进行一次热编码,并取决于有多少颜色如果你有,你要么想要在颜色空间中编码它们,比如 RGB,或者如果你没有那么多的话,你可以对它们进行热编码。然后,您将需要对您拥有的路线进行一次热编码。对于代码 2,它看起来是定量的,因此您可能可以规范化该行。对于代码 1,您可能只需要对字母进行一次热编码,然后对其进行规范化。一旦你拥有了定量形式的所有训练数据,如果你有很多训练数据,并且训练数据足够复杂,你可以使用深度神经网络。否则,

其他答案很好,但是由于数据的结构方式,关于决策树的 kiner-shah 评论对我来说效果最好。