我想知道是否可以根据 X 中的特征来衡量 Y 中的两个类是否可分离(线性或非线性)。解释这一点的最简单方法是将其与相关系数进行比较,相关性越高,可能性越高基于给定特征的成功回归(至少在理论上)。
在训练 ML 模型之前,是否有任何措施可以告诉我根据输入数据特征分离类的效果如何?
我想知道是否可以根据 X 中的特征来衡量 Y 中的两个类是否可分离(线性或非线性)。解释这一点的最简单方法是将其与相关系数进行比较,相关性越高,可能性越高基于给定特征的成功回归(至少在理论上)。
在训练 ML 模型之前,是否有任何措施可以告诉我根据输入数据特征分离类的效果如何?
你在想像信息增益这样的东西吗?
信息增益基本上使用信息熵的概念来确定拆分变量是否有用。