Python的分类问题方法

数据挖掘 机器学习 Python 预测建模 可能性
2022-02-27 12:50:43

我是一名 Python 初学者,刚刚进入机器学习领域,需要关于我应该用于解决问题的方法的建议。

这是我的数据集的一个例子。 在此处输入图像描述

如果 RESULT 是每个 VALUES 数组中的相应索引,并且每一行都是一个单独的数组,我需要根据其配置找到数组的每个索引是 RESULT 的概率,其中整体配置和分布是最重要的,而不是任何个人价值。

1个回答

您正在查看分类问题

逻辑回归决策树支持向量机以上任何一项都可以为您解决工作。但是选择最好的模型取决于它预测测试集的能力。使用交叉验证,看看哪个模型可以给你更好的准确性。因此,相应地拆分您的测试和训练集。如果你没有训练它,你不会期望模型能够预测。请参阅分层抽样

尽管您的预测变量可能是分类的或序数的,但它们可以被视为数字

您已经内置了predict_proba等函数来查找类概率。可以在上面的链接中找到这方面的参考资料。但是请了解它们的工作原理以及在任何分类中选择最佳飞机的策略是什么,这样您就不会觉得自己在使用黑匣子。既然你说你是初学者,pandas将是一个非常有用的模块,用于将数据读入数据帧并根据需要进行修改。

希望这能清除一些东西。