数据科学中的 X、Y 名称

数据挖掘 数据 机器学习模型
2022-03-06 14:51:14

我来自 CS 背景并转向数据科学,我开始知道 ML 受到统计推断/信号处理的高度影响。我们在数据科学中使用的 X 称为输入、特征集或自变量,Y 称为目标、类别、标签。你怎么称呼它?从业者的市场和领域有区别吗?

2个回答

我为 X 找到的几个名字是:

  • 特征向量
  • 输入变量
  • 自变量
  • 解释变量
  • 外生变量
  • 预测变量
  • 回归者
  • 协变量

根据个人经验,大多数是X的输入特征以及 Y 的输出标签。尽管如此,其他术语也很常见,主要取决于人的背景(您已经列出了一些)。

X

  • 输入
  • 特征
  • 特征向量
  • 自变量/解释变量/外生变量
  • 预测变量

  • 输出
  • 标签(已知结果)
  • 依赖/解释/预测变量
  • 结果
  • 目标

另外,请注意目标和标签并不总是意味着同一件事:因为某些标签代表目标变量的已知结果,这意味着某些输入可能没有与之关联的标签(参见无监督/半监督学习)。