训练集中的单个元素如何命名?

数据挖掘 数据 术语
2022-01-28 10:01:06

这个问题只是关于词汇的。

做/你能说

  1. 数据项
  2. 数据样本
  3. 记录
  4. 样本
  5. 数据点
  6. 别的东西

当您谈论训练/测试集的元素时?例如:

图中显示了训练集的 100 个数据项。

数据库 A 包含与数据库 B 相同的数据项,但格式不同。

其余数据项已从数据集中删除。

这 10 个类有 123456 个数据项。

请提供带有示例的论文。

根据谷歌 n-gram

在此处输入图像描述

1个回答

您正在寻找的术语是“示例”。资料来源:谷歌研究科学家 Martin Zinkevich ( http://martin.zinkevich.org/rules_of_ml/rules_of_ml.pdf )

实例:您要对其进行预测的事物。例如,该实例可能是您想要分类为“关于猫”或“不是关于猫”的网页。

标签:预测任务的答案,可以是机器学习系统产生的答案,也可以是训练数据中提供的正确答案。例如,网页的标签可能是“关于猫”。

特征:预测任务中使用的实例的属性。例如,网页可能具有“包含单词'cat'”的功能。

示例:一个实例(及其特征)和一个标签。