如何在目标数据中训练具有多个值的 ML 算法?

数据挖掘 机器学习 Python 数据
2021-10-12 04:50:08

我是数据科学和机器学习的新手,正在寻求帮助。我正在尝试使用以下数据集训练机器:

在此处输入图像描述

这里,L3 是目标变量。可以看出目标变量包含一组可能的值,我想知道如何用这样的数据训练机器。在我的测试数据中,我可能想要预测给定一个值的任何一个或多个值。示例测试用例:

20 个氨基酸

'aa' 是给定的值,我想根据值 20、c 和 'aa' 预测其他值。有可能做我想要达到的目标吗?

谢谢你。

2个回答

因为你的测试用例可能有来自 L3 的值作为输入,这让我觉得它更像是一个推荐系统考虑将 L3 中的每个可能值编码为一个新的二进制列(将它们视为每个行/用户已购买/表示感兴趣的产品),并研究不同类型的推荐系统,以查看哪些似乎最适合您的数据。

(我对推荐器不太熟悉。AIUI,这些都是聚类算法,但距离概念不同,侧重于产品或用户。 sklearn似乎没有任何专门用于推荐的内置插件,但你可以将它用于底层模型。还有一些其他 Python 包专门针对推荐者,但我不能推荐任何[看看我在那里做了什么?]。)

有可能的。

它被称为多输出回归。允许您预测多个变量:

多输出回归