我有一个数据集在训练、测试和验证拆分中分开。
在每个 epoch 之后,我都会评估验证拆分中的损失和准确性。
当验证拆分的损失不是更好时,我停止训练并选择它作为最终模型。
但是,我应该将训练和验证合并为最终模型吗?如何选择最佳型号?
我有一个数据集在训练、测试和验证拆分中分开。
在每个 epoch 之后,我都会评估验证拆分中的损失和准确性。
当验证拆分的损失不是更好时,我停止训练并选择它作为最终模型。
但是,我应该将训练和验证合并为最终模型吗?如何选择最佳型号?
我真的很喜欢这篇回答你问题的帖子。
一旦我们有了估计的技能,我们就完成了重采样方法。
您通过对所有数据应用所选的机器学习过程来完成模型。
这意味着在模型达到足够的性能后,我们不再需要拆分(“重采样方法”)。然后我们可以合并所有可用的数据并重复学习过程。我们可以依赖最终的表现(不用担心,谁模型将在训练期间使用新数据表现),因为它已经学会了如何为特定任务泛化输入(例如区分猫和狗)。
测试工具的精心设计对于应用机器学习至关重要。更强大的测试工具将使您更加依赖估计的性能。