我在开始处理具有多个功能的多类问题时遇到问题,希望有人能指出我正确的方向。
我有这样结构的数据用于训练:
Item State Code1 Code2 Code3 Route
--- --- --- --- --- ---
item1 MI A1 33 blue Route1
item2 TX A3 35 yellow Route2
item3 NM A4 36 green Route3
item4 NM A4 37 green Route3
本质上,我试图弄清楚从哪里开始。目标是根据功能状态、代码 1、2 和 3 知道将项目路由到哪里。路由取决于代码和状态的混合,我想构建一个模型,说明当我有代码 X , Y, Z 和颜色 XX,那么它可能是路线 1(当然,训练数据中的某些路线可能有 X、Y 作为代码和不同的 Z)
我假设我需要对状态和代码等功能进行一次性编码?但是从那里有人知道我应该选择哪种类型的模型吗?我会假设某种神经网络,我已经探索了 CNN 和 Random Forrest。