Kaggle 比赛根据保留的测试集确定最终排名。
一个保留的测试集是一个样本;它可能不代表被建模的人群。由于每次提交都像是一个假设,因此赢得比赛的算法可能只是完全有可能最终比其他算法更好地匹配测试集。换句话说,如果选择不同的测试集并重复比赛,排名会保持不变吗?
对于赞助公司来说,这并不重要(可能前 20 名的提交会提高他们的基线)。尽管具有讽刺意味的是,他们最终可能会使用比其他前五名更差的排名第一的模型。但是,对于参赛者来说,Kaggle 似乎最终是一场机会游戏——偶然发现正确的解决方案并不需要运气,而是偶然发现与测试集匹配的解决方案!
有没有可能改变比赛,让统计上无法区分的顶级球队全部获胜?或者,在这一组中,最节俭或计算成本最低的模型能否获胜?