我正在尝试建立一个地板类型的图像分类模型。有一个名为OpenSurfaces的开放数据集,其中包含按房间上出现的每个项目的材料类型分割的图像。
像这样的东西:
我认为使用这个数据集来训练地板检测模型会是一件好事,所以我编写了一个脚本来提取我想要检测的材料(木材、瓷砖、地毯、大理石、石头……)。这些是我通过脚本获得的图像的一些示例:
木质材料:
瓦:
地毯:
然后我训练了一个 CNN,但我只有 70% 的准确率,如果我走的是正确的道路,我现在真的没有。是用我提取的图片训练模型更好,还是用整个房间的图像训练它更好,而不是分割的部分?
我很迷茫,所以任何指导将不胜感激。