数据挖掘 - 分类变量的最佳 MIMO 预测算法 - 吾爱随笔录

我研究机器学习已经有一段时间了，想测试一下我的知识。所以我试图用它来预测彩票号码。目标不是有 100% 正确的预测（这当然是不可能的），而是比纯随机预测表现更好。

基本上，我有以下数据：

[
 [3,10,16,19,34,45],
 [7,14,15,20,28,41],
 [2,6,18,24,30,37],
...
]

可以看出，每轮将抽取六个数字，我假设这些轮不是独立的，并且每一轮都与前一轮相关。所以我正在寻找一种预测算法，它将尝试了解这一点并输出一个或多个预测。

这将是算法的监督学习。使用上面的示例数据，将对其进行预处理，使其变为：

[
 [[3,10,16,19,34,45], [7,14,15,20,28,41]],
 [[7,14,15,20,28,41], [2,6,18,24,30,37]],
 ...
]

显然，对于每个元组，输入在左侧，而输出在右侧。此外，我还有另一个假设，即印在球上的数字实际上只是标签，因此算法应该将它们视为分类属性而不是数字属性。这些标签没有排序，尽管数据按数字升序排列。所以当算法试图从训练数据中学习时，它不应该以任何方式受到球排序的影响。

最后，在它被训练之后，如果我输入，例如 [3,5,6,11,34,42]，它应该输出算法的最佳猜测预测列表。

那么对于此类任务，最好的预测算法和推荐的编程工具是什么？

编辑：理论上，本轮应该与前轮无关。但我仍然认为它们确实有一些相关性（虽然很少），这并不明显且难以解释。