我正在阅读 Scikit-learn,但我无法理解示例和功能。(n_samples, n_features)
任何人都可以通过例子来描述这些吗?
什么是样本和特征
数据挖掘
机器学习
scikit-学习
2022-02-15 09:37:16
2个回答
[x[1,2,3,4], x2[1,2,2,3], x[2,3,2,1]] 上面的数据有4个特征。我们可以给这些特征标签加上标题。我们只称它们为特征 1、特征 2、特征 3。对于第一个条目,特征 1 的值为 1,特征 2 的值为 2,依此类推。
样本是从数据集中获取的数据子集。x[1,2,3,4] 是数据集的单个样本。
无论你想用 Scikit-learn 做什么,都想知道你有多少特征,我的例子有 4 个特征(或列)。
样本通常是您正在训练的项目数。在数字数据集中,样本数是所有作者写的位数。然后可以以各种方式表示每个数字,例如,作为 XYZ 空间中的坐标,可能是写入每个数字的压力水平,等等。它们是特征。
其它你可能感兴趣的问题