遗漏一个主题和遗漏一个交叉验证有什么区别

数据挖掘 机器学习 Python 分类 scikit-学习
2022-03-13 00:45:54

将一个主题排除在 cv 之外和将一个主题排除在交叉验证 (loocv) 之间有什么区别?它们是相同的还是不同的?我有 24 个主题的图像,根据文献,由于其主观性,留下一个主题是疼痛表达检测的最佳交叉验证。是否有任何功能可以像 loocv 一样在 sklearn 中将一个主题留在 cv 中?或者我必须手动保留一个主题图像(23 个主题中的一个)并训练其余 23 个主题?这是正确的方法吗?

1个回答

留下一个主题可以确保您没有主题偏见。

您在训练和测试数据集中拥有相同主题的事实将使模型对您的主题了解得更多。对于一个全新的主题,该模型可能会表现不佳,因为它以前从未在该主题上进行过训练。

sklearn 中没有这样的工具,因为如果主题 id 是数据集中的列,则很容易构建自己的工具。