我研究机器学习已经有一段时间了,想测试一下我的知识。所以我试图用它来预测彩票号码。目标不是有 100% 正确的预测(这当然是不可能的),而是比纯随机预测表现更好。
基本上,我有以下数据:
[
[3,10,16,19,34,45],
[7,14,15,20,28,41],
[2,6,18,24,30,37],
...
]
可以看出,每轮将抽取六个数字,我假设这些轮不是独立的,并且每一轮都与前一轮相关。所以我正在寻找一种预测算法,它将尝试了解这一点并输出一个或多个预测。
这将是算法的监督学习。使用上面的示例数据,将对其进行预处理,使其变为:
[
[[3,10,16,19,34,45], [7,14,15,20,28,41]],
[[7,14,15,20,28,41], [2,6,18,24,30,37]],
...
]
显然,对于每个元组,输入在左侧,而输出在右侧。此外,我还有另一个假设,即印在球上的数字实际上只是标签,因此算法应该将它们视为分类属性而不是数字属性。这些标签没有排序,尽管数据按数字升序排列。所以当算法试图从训练数据中学习时,它不应该以任何方式受到球排序的影响。
最后,在它被训练之后,如果我输入,例如 [3,5,6,11,34,42],它应该输出算法的最佳猜测预测列表。
那么对于此类任务,最好的预测算法和推荐的编程工具是什么?
编辑:理论上,本轮应该与前轮无关。但我仍然认为它们确实有一些相关性(虽然很少),这并不明显且难以解释。