数据挖掘 - 什么是样本和特征 - 吾爱随笔录

数据挖掘机器学习 scikit-学习

2022-02-15 09:37:16

我正在阅读 Scikit-learn，但我无法理解示例和功能。(n_samples, n_features)
任何人都可以通过例子来描述这些吗？

2个回答

[x[1,2,3,4], x2[1,2,2,3], x[2,3,2,1]] 上面的数据有4个特征。我们可以给这些特征标签加上标题。我们只称它们为特征 1、特征 2、特征 3。对于第一个条目，特征 1 的值为 1，特征 2 的值为 2，依此类推。

样本是从数据集中获取的数据子集。x[1,2,3,4] 是数据集的单个样本。

无论你想用 Scikit-learn 做什么，都想知道你有多少特征，我的例子有 4 个特征（或列）。

样本通常是您正在训练的项目数。在数字数据集中，样本数是所有作者写的位数。然后可以以各种方式表示每个数字，例如，作为 XYZ 空间中的坐标，可能是写入每个数字的压力水平，等等。它们是特征。

其它你可能感兴趣的问题