我想从由 4000 张照片(3072*2048)组成的数据集中创建一个船舶检测分类器。
但是我目前拥有的数据集没有标记 ,因此我可以将其提供给cnn。所以我想将此数据集聚类到 2 个标签(或 2 个目录)ship和no_ship。我尝试运行 k-means,但结果令人失望。还有其他更实用的方法吗?
我想从由 4000 张照片(3072*2048)组成的数据集中创建一个船舶检测分类器。
但是我目前拥有的数据集没有标记 ,因此我可以将其提供给cnn。所以我想将此数据集聚类到 2 个标签(或 2 个目录)ship和no_ship。我尝试运行 k-means,但结果令人失望。还有其他更实用的方法吗?
这是你可以尝试的。
Softmax()
或图层之后的Flatten()
图层首先,请记住这一点:
我可以看到两个选项:
正如文森特·杨 ( Vincent Young ) 所建议的,您可以找到经过类似检测任务训练的预训练网络。ModelZoo是为您正在使用的框架查找预训练网络的好地方。
K-Means 是直截了当的,但有一些流程。它不能很好地处理大小不均匀的集群,并且由于欧几里得距离,它会学习创建圆形集群。
Mean-shift 可以处理任意特征空间并且可以使用任意核函数。您可能最终不会得到 2 个集群,但无论如何您都可以找到有用的集群。关于这一点,如果您尝试使用超过 2 个集群和 K-Means,您可能会发现一些集群是“纯的”(包含单个类),而有些可能是混合的。这些纯集群可以是一个好的开始。
我在我的网站上写了一章关于 Mean Shift 的章节,包括其他资源,如果你想阅读的话。