Kaggle 上的公开测试和私人测试有什么区别

数据挖掘 机器学习 数据集 卡格尔
2022-02-10 05:12:41

我正在尝试使用Kaggle 上举行的比赛中的数据,其中数据集包含 fer2013.csv 文件,其中包含情感、像素和使用列,其中使用包含 3 个值,即“培训”、“私人测试”和“公共测试”。所以我没有得到什么是 publictest 和 privatetest。有人可以向我解释它是什么,将不胜感激?

2个回答

“publictest”数据用于计算比赛进行时公共排行榜的得分。

比赛结束后,将根据标记为“privatedataset”的数据对参赛者进行排名。

需要私有测试数据,因为竞争者原则上可以过度拟合公开测试数据。

在 Kaggle 上,您可以多次提交分数并查看您的表现。通过这种不断的反馈,人们可能会有意或无意地过度拟合。

评估模型在全新和看不见的数据上的性能是一种很好的做法。