我正在使用各种数据集对用于面部表情识别的卷积神经网络进行训练/测试——所有数据集都由 7 个情绪类标记。
对于其他数据集,有大量主要是独特的主题,所以我随机拆分。然而,在这种情况下,只有 6 个主题,但每个类别中的每个主题都有大量图像。由于图像的相似性,随机分割似乎无效 - 想想每帧情绪如何变化。
将整个主题分开进行测试的最佳方法是什么?或者是其他东西?
我确实使用随机拆分运行了网络并达到了 100% 的验证准确度,所以我认为这不太可能是最好的方法。谢谢你的时间。
我正在使用各种数据集对用于面部表情识别的卷积神经网络进行训练/测试——所有数据集都由 7 个情绪类标记。
对于其他数据集,有大量主要是独特的主题,所以我随机拆分。然而,在这种情况下,只有 6 个主题,但每个类别中的每个主题都有大量图像。由于图像的相似性,随机分割似乎无效 - 想想每帧情绪如何变化。
将整个主题分开进行测试的最佳方法是什么?或者是其他东西?
我确实使用随机拆分运行了网络并达到了 100% 的验证准确度,所以我认为这不太可能是最好的方法。谢谢你的时间。
我认为您正在了解这样一个事实,即通过对相同主题的训练和测试,您的模型将无法很好地推广到新主题。如果您只对预测这些主题的情绪感兴趣,那么您就采取了正确的方法。但是,如果您想将模型推广到新的、看不见的主题,您应该拆分训练集和测试集,使训练集中的主题不在测试集中,反之亦然,以获得更准确的测试分数。它很可能不会表现得那么好,如果可能的话,您应该考虑收集更多关于新主题的数据。
这是Stack Exchange上的类似问题。