决策树算法是线性的还是非线性的

数据挖掘 机器学习 分类 决策树 算法 pac学习
2021-09-13 21:53:20

最近我的一个朋友在采访中被问到决策树算法是线性算法还是非线性算法。我试图寻找这个问题的答案,但找不到任何令人满意的解释。任何人都可以回答并解释这个问题的解决方案吗?另外,还有哪些非线性机器学习算法的其他例子?

4个回答

决策树是 到 的非线性X映射y如果您采用任意函数并创建一棵树到其最大深度,这很容易看出。

例如:

if x = 1, y = 1
if x = 2, y = 15
if x = 3, y = 3
if x = 4, y = 27
...

当然,这是一个完全过拟合的树,不会一概而论。但它说明了为什么决策树是非线性映射。

最近我的一个朋友在面试中被问到决策树算法是线性算法还是非线性算法

决策树与神经网络等类似,是一种非线性分类器,一般用于对非线性可分数据进行分类。

即使考虑回归示例,决策树也是非线性的。

例如,线性回归线看起来有点像这样:

在此处输入图像描述

红点是数据点。

决策树回归图看起来像这样:

在此处输入图像描述

因此,显然决策树是非线性的

正如许多人指出的那样,回归/决策树是一种非线性模型。但是请注意,它是一个分段线性模型:在每个邻域(以非线性方式定义)中,它是线性的。实际上,模型只是一个局部常数。

在最简单的情况下看到这一点,一个变量,一个节点 θ,树可以写成线性回归

是的一世=α11(X一世<θ)+α21(X一世θ)+ε一世

在哪里 1(一个) 是指示函数,如果事件 A 为真,则取值为 1,否则为 0。

决策树是非线性的。与线性回归不同,没有方程来表达自变量和因变量之间的关系。

前任:

线性回归 - 水果价格 = b0 + b1*新鲜度 + b2*尺寸

决策树 - 节点:成熟 - 是或否 | 新鲜 - 是或否 | 尺寸 - <5, >5 但 <10 和 >10 |

在第二种情况下,自变量和因变量之间没有线性关系。