数据挖掘 - 我应该使用哪种 ML 算法来进行以下分类用例，为什么？ - 吾爱随笔录

我应该使用哪种 ML 算法来进行以下分类用例，为什么？

数据挖掘机器学习机器学习模型数据科学模型天蓝色毫升

2022-03-07 12:20:13

我有表格格式的数据，总共有 3 列。一列是标签，另外两列是特征。因此，这样的 30 行（1 行包含 2 个特征和 1 个标签）构成一组数据，所有 30 行都具有相同的数据。在这 30 行中，可能存在一些特征模式。可能会有更多这样的 30 行集（30 行标签将相同）。所以会有6到7个标签或类。我想要算法从 30 行（一组）中预测一个标签。我应该选择哪种算法以及如何预处理数据？

2个回答

您可以查看https://autogluon.mxnet.io/

from autogluon import TabularPrediction as task
predictor = task.fit(train_data=task.Dataset(file_path=TRAIN_DATA.csv), label=COLUMN_NAME)
predictions = predictor.predict(task.Dataset(file_path=TEST_DATA.csv))

对于预处理，您可以使用 Python 中 sklearn.preprocessing 库中的 StandardScalar 或 MinMaxScalar。对于分类决策树和随机森林，神经网络是很好的 ML 算法。
检查这个。

其它你可能感兴趣的问题

上一篇使用 OneHotEncoder 忽略看不见的列下一篇在 Python 中匹配数据集中街道地址的最佳方法是什么？