我正在尝试优化 8 张卡片与 64 个卡片字符的组合。没有重复和顺序无关紧要。
n!/(n!(nr)!) = 4,426,165,368 种组合
我已经设置好了所有东西,包括数据抓取器。但我不知道我的机器需要学习多少游戏才能开始看到模式。例如,在分析的 14,000 场比赛中,只有 834 套牌具有特定的特征。
从 834 张牌中分析接下来的 7 张牌是 621,216,192
所以我想在可靠模式出现之前我需要更多数据......但是有多少数据?谢谢你,上帝保佑
我正在尝试优化 8 张卡片与 64 个卡片字符的组合。没有重复和顺序无关紧要。
n!/(n!(nr)!) = 4,426,165,368 种组合
我已经设置好了所有东西,包括数据抓取器。但我不知道我的机器需要学习多少游戏才能开始看到模式。例如,在分析的 14,000 场比赛中,只有 834 套牌具有特定的特征。
从 834 张牌中分析接下来的 7 张牌是 621,216,192
所以我想在可靠模式出现之前我需要更多数据......但是有多少数据?谢谢你,上帝保佑
对不起,没有人能给你一个号码。
正如 Manngo 在评论中所述,一般规则:尽可能多。我还看到 10x 数字被抛出,请参见此处。根据这个“规则”,您需要的示例数量大约是模型中自由度的 10 倍。
您需要多少数据是您只能通过实证调查来回答的问题。您需要收集的数据量受数据的复杂性、数据的维度和您打算训练的算法的影响(尽管这可以通过调节来控制,有关更多信息,请参阅Jake Vanderplas的这篇优秀博文)。
这个问题 你可能会感兴趣。