我在训练集中有两个类:一个具有具有特征的图像,另一个具有没有该特征的图像。是否可以有更多“无特征”的图像,以便我可以适应所有可能的误报?
卷积神经网络的两个数据类,一个可以比另一个有更多的训练图像吗?
人工智能
人工智能设计
分类
喀拉斯
2021-10-21 04:36:34
2个回答
您的问题非常笼统,因此,在这种情况下,我的回答也将是:
答案是“有时”:这取决于数据。
一类中的图像可能比另一类多得多,您仍然可以获得合理的结果。这在很大程度上取决于您拥有多少“要素类”数据。
如果是这种情况,我们说类严重不平衡,你需要做“类平衡”。您不想对这一类进行过度拟合,最好希望要素类最大。
CNN 的另一种方法是使用“dropout”。好吧,对于 CNN,您可以走得更远:您可以删除部分图像以生成“新”图像。这样可以防止“特征”类的过度拟合,同时生成更多数据。
我怀疑如果不以某种方式过度拟合网络,就不可能训练所有可能的误报。
希望它有帮助,并给你一些谷歌指针:)
仅供参考:在技术术语中,您基本上想知道使用严重不平衡的数据集进行二进制 CNN 分类是否有效。
我认为您实际上正在研究一个类别分类,因为另一个类别的功能较少。因此,您最终将对输入数据进行分类,因为它是否属于该单个类。
如果您可以将您的问题视为一类分类,那么我会说您实际上根本不需要特征较少的数据集。您可以使用自动编码器直接运行您的特色数据(比如猫图片)并找出瓶颈处的阈值(这有点挑战性)。稍后在测试期间,您可以通过查看自动编码器的编码部分产生的阈值来验证输入数据是否属于所需的类。
如果这个答案不能让你满意。您可以只搜索“一类分类”或“离群检测”等关键字。我想从那里你可以很容易地跟进。
其它你可能感兴趣的问题