是否可以进行 k 折交叉验证来测试所有数据,而不是像通常那样使用 kfcv 来找到最佳假设。
例子:
假设我想在大小为 1000 的数据集上使用 svm。我可以使用 900 个事件来训练 svm 以测试其他 100 个事件。然后使用单独的 900 个事件为单独的 100 个事件训练 svm,重复此过程 10 次,直到所有数据都经过测试。
使用单独训练的 svm 测试的事件是否具有可比性?即通过这种技术,我可以使用我的整个数据集而不是留出一定的一部分进行训练,或者这是在统计上不明智的事情吗?
谢谢你的帮助,
科罗拉多州
PS)非常感谢任何关于为什么会['nt]工作的参考,我正在学术环境中讨论这种技术。