使用具有 3 维输入点的决策树

数据挖掘 分类 决策树
2022-03-17 10:36:11

我实现了一个正常的分类树(它使用基尼指数来寻找分裂)。我用它来预测人们的年龄。我的输入数据是一个轴上的一系列点(只有 X 坐标),输出是一个年龄(9 岁,10 岁......)。

例子:

p1 = 1.3, p2 = 3.4, p3 = 2.1 ........ => 输出 = 9 岁

p1 = 1.4, p2 = 2.4, p3 = 2.6 ........ => 输出 = 10 岁

我的树看起来像(只是一个例子):

if p1 > 1
    if p2 < 3
        output = 10 years old
    else 
        output = 9 years old
else
    ...

这工作正常。

现在我想修改它,使用 3D 点。我的意思是具有 X、Y、Z 而不仅仅是 X 的点。

所以我的输入数据如下:

p1 = [1.2, 1.5, 4.3], p2 = [4.2, 1.3, 5.2] .... => 输出 = 9 岁

我该如何处理?我的树应该将每个坐标用作单独的输入(p1x、p1y、p1z、p2x、p2y ......)还是有适合我的情况的方法?

注意:我正在使用分类树,但如果您认为在我的情况下还有另一种预测方式,我很想知道它。

我也在使用 python 代码,但我正在寻找逻辑而不是编程部分。

谢谢

1个回答

每个人使用单个向量(p1x,p1y,p1z,p2x,p2y ....)将是最简单和最明显的方法。

也许,通过包含这些特征的其他一些转换,您的预测也会得到改善。但通常树木渴望有效地使用您提供给它们的所有信息。所以只要一个 9 维向量就可以了。