分类变量的最佳 MIMO 预测算法

数据挖掘 机器学习 预测建模 分类数据
2022-03-07 13:36:47

我研究机器学习已经有一段时间了,想测试一下我的知识。所以我试图用它来预测彩票号码。目标不是有 100% 正确的预测(这当然是不可能的),而是比纯随机预测表现更好。

基本上,我有以下数据:

[
 [3,10,16,19,34,45],
 [7,14,15,20,28,41],
 [2,6,18,24,30,37],
...
]

可以看出,每轮将抽取六个数字,我假设这些轮不是独立的,并且每一轮都与前一轮相关。所以我正在寻找一种预测算法,它将尝试了解这一点并输出一个或多个预测。

这将是算法的监督学习。使用上面的示例数据,将对其进行预处理,使其变为:

[
 [[3,10,16,19,34,45], [7,14,15,20,28,41]],
 [[7,14,15,20,28,41], [2,6,18,24,30,37]],
 ...
]

显然,对于每个元组,输入在左侧,而输出在右侧。此外,我还有另一个假设,即印在球上的数字实际上只是标签,因此算法应该将它们视为分类属性而不是数字属性。这些标签没有排序,尽管数据按数字升序排列。所以当算法试图从训练数据中学习时,它不应该以任何方式受到球排序的影响。

最后,在它被训练之后,如果我输入,例如 [3,5,6,11,34,42],它应该输出算法的最佳猜测预测列表。

那么对于此类任务,最好的预测算法和推荐的编程工具是什么?

编辑:理论上,本轮应该与前轮无关。但我仍然认为它们确实有一些相关性(虽然很少),这并不明显且难以解释。

1个回答

您正在尝试在这里预测随机数。按照设计,彩票号码是不相关的,一轮对下一轮没有影响。对于机器学习,您应该使用具有某种“预测能力”的输入。我的意思是作为与目标变量的一些信息或相关性的数据。你当然可以在这样的数据上训练一个预测算法,但这对我来说没有意义。如果您发现一些可靠的预测,这可能意味着彩票不会抽取随机数。...这实际上应该是评论,但 StackExchange 不允许我写评论。