有一个名为numer.ai的数据挖掘竞赛网站。
据推测,该网站背后是一个对冲基金,它利用人们发送的预测。排名前 100 位的人不断赚钱,直到下一个数据集公布,比赛重新开始。
我不明白的是,像 Kaggle 这样的网站通过拥有公共和私人排行榜来避免过度拟合。私人排行榜仅在比赛结束时公布,然后才发放奖品。
Numerai 根据规则表示,它使用相同的方法。报价:
如果模型过度拟合公共排行榜并且在私人排行榜上表现不佳,则这些用户将遭受惩罚,可能会消除所有收益。这会阻止过度拟合。
他们所说的“惩罚”是什么意思?我知道有人通过持续玩公共排行榜在该网站上赚钱。这是否意味着如果他不提取他的比特币,如果他过度拟合,他就有可能失去他所赚的钱?