在我看来,我有一个稍微复杂的决策树问题版本,无法弄清楚如何建模,我试图避免“将其转储到 NN”解决方案中。
我有一堆专家意见(来自人或算法),其中特征维度重叠。特征(输入)和输出(决策)都是分类的,但我对决策也有确定性(比如说 0-1)。
例如,假设输入特征是 a,b,c,d,e,并且有一个来自 v,w,x,y,z 的输出(决策):
Features Decision certainty
a,b,c w 0.5
b,c,d,e z 0.4
a,c,e,f v 0.75
...
如果没有确定性,这显然只是一个微不足道的分类决策树问题。然而,确定性既简化了问题,也使问题复杂化了。如果 features->decision 数据不一致(它是!),它会简化它,你根本没有输出,所以确定性使我免于失败模式,但另一方面,我不确定是什么正确地处理确定性。
确定性表明贝叶斯组合,如果数据是一维的,这也是微不足道的。所以我有点夹在决策树和贝叶斯模型之间。一个明显的解决办法是将其转储到一个 NN(甚至只是一个 NB 或回归)中,使用确定性作为类别的输出,或者做一些愚蠢的事情,比如根据(非)确定性复制 I/O 配对。
在此先感谢您的任何建议。