我来自 CS 背景并转向数据科学,我开始知道 ML 受到统计推断/信号处理的高度影响。我们在数据科学中使用的 X 称为输入、特征集或自变量,Y 称为目标、类别、标签。你怎么称呼它?从业者的市场和领域有区别吗?
数据科学中的 X、Y 名称
数据挖掘
数据
机器学习模型
2022-03-06 14:51:14
2个回答
我为 X 找到的几个名字是:
- 特征向量
- 输入变量
- 自变量
- 解释变量
- 外生变量
- 预测变量
- 回归者
- 协变量
根据个人经验,大多数是X的输入或特征以及 Y 的输出或标签。尽管如此,其他术语也很常见,主要取决于人的背景(您已经列出了一些)。
X:
- 输入
- 特征
- 特征向量
- 自变量/解释变量/外生变量
- 预测变量
是:
- 输出
- 标签(已知结果)
- 依赖/解释/预测变量
- 结果
- 目标
另外,请注意目标和标签并不总是意味着同一件事:因为某些标签代表目标变量的已知结果,这意味着某些输入可能没有与之关联的标签(参见无监督/半监督学习)。
其它你可能感兴趣的问题