我有表格格式的数据,总共有 3 列。一列是标签,另外两列是特征。因此,这样的 30 行(1 行包含 2 个特征和 1 个标签)构成一组数据,所有 30 行都具有相同的数据。在这 30 行中,可能存在一些特征模式。可能会有更多这样的 30 行集(30 行标签将相同)。所以会有6到7个标签或类。我想要算法从 30 行(一组)中预测一个标签。我应该选择哪种算法以及如何预处理数据?
我应该使用哪种 ML 算法来进行以下分类用例,为什么?
数据挖掘
机器学习
机器学习模型
数据科学模型
天蓝色毫升
2022-03-07 12:20:13
2个回答
您可以查看https://autogluon.mxnet.io/
from autogluon import TabularPrediction as task
predictor = task.fit(train_data=task.Dataset(file_path=TRAIN_DATA.csv), label=COLUMN_NAME)
predictions = predictor.predict(task.Dataset(file_path=TEST_DATA.csv))
对于预处理,您可以使用 Python 中 sklearn.preprocessing 库中的 StandardScalar 或 MinMaxScalar。对于分类决策树和随机森林,神经网络是很好的 ML 算法。
检查这个。