如何在我的模型中输入列表而不关心订单

数据挖掘 机器学习 数据 理论
2022-03-04 14:03:12

我正在尝试预测一个数字列表,例如:

[23,55,198,200,64]

我拥有的数据包括多项内容,以及:
上一次运行的数字(这些数字来自科学实验)
以前所有数字列表的列表
例如,如果两次运行前我们得到[22,24,77,187,21]
然后运行我们得到[90,22,76,88,29]
我们现在有一个列表

[[22,24,77,187,21],[90,22,76,88,29]]

重要的是,数字的顺序无关紧要。
[22,24,77,187,21]而且[77,22,187,24,21]都是同一件事。

我该如何为我的模型提供这些数据,让它意识到这两个选项都是正确的?

2个回答

如果可能整数的范围很小,则将每个整数的存在编码为特征向量中的布尔列。

取值范围为 0-5 的示例。

[1,3,4], [4,3,1], [3,1,4]都将被编码为[0,1,0,1,1,0]

拥有一系列数字,从科学的角度来看,这些数字的顺序并不重要,但从编程的角度来看,它们并不一定很容易进行比较。

比较它们的一种简单方法是首先对它们进行系统排序(如果您需要保留初始数据,可能在一个单独的数组中),即使它们的顺序无关紧要。