numer.ai:他们的排行榜系统是如何运作的?

数据挖掘 数据挖掘 比赛 过拟合
2021-09-20 15:21:23

有一个名为numer.ai的数据挖掘竞赛网站。

据推测,该网站背后是一个对冲基金,它利用人们发送的预测。排名前 100 位的人不断赚钱,直到下一个数据集公布,比赛重新开始。

我不明白的是,像 Kaggle 这样的网站通过拥有公共和私人排行榜来避免过度拟合。私人排行榜仅在比赛结束时公布,然后才发放奖品。

Numerai 根据规则表示,它使用相同的方法。报价:

如果模型过度拟合公共排行榜并且在私人排行榜上表现不佳,则这些用户将遭受惩罚,可能会消除所有收益。这会阻止过度拟合。

他们所说的“惩罚”是什么意思?我知道有人通过持续玩公共排行榜在该网站上赚钱。这是否意味着如果他不提取他的比特币,如果他过度拟合,他就有可能失去他所赚的钱?

1个回答

我在他们博客的评论部分找到了答案:

公共分数排行榜上列出的收入是潜在的奖金。实际奖金由私人得分排行榜决定。在提款时和新数据集发布时,您的实际奖金将向您透露。