如何将数据提供给机器学习模型?

数据挖掘 Python 数据集 数据 支持向量机 机器学习模型
2022-03-02 00:54:47

我正在将 SVM 模型作为我的大学项目。目标是确定肿瘤是良性还是恶性。我正在用 Python 实现模型。我从Gene Expression Omnibus中找到了数据集

链接到数据集该数据集与甲状腺癌有关。向下滚动时,您可以看到一个表格。我的问题是如何将这些数据提供给我的模型。

我对处理数据集没有太多想法。你能告诉我更多关于来自上述网站的数据集吗?我没有正确理解它。

如果你能帮我解决这个问题,我会很高兴。我对各种建议和想法持开放态度。如果您知道任何其他数据集存储库,请告诉我。

祝你有美好的一天。

1个回答

您可以在将数据提供给模型之前将数据作为 SVM(train_X,train_Y) 提供,对数据进行必要的预处理,例如对分类变量进行虚拟或单热编码,并在数值列值的平均值相隔 10 倍或更多时缩放数值变量