如何检测视频流中包含城墙上涂鸦的帧?

人工智能 深度学习 计算机视觉 图像识别 迁移学习
2021-10-18 19:36:40

我正在做一个涂鸦检测项目。我需要分析来自侧面安装在车辆上的摄像头的数据流,以识别城墙上的涂鸦,并通知当局以最佳方式捕捉涂鸦及其地理位置等。

我正在尝试对我的涂鸦图像数据集使用迁移学习在 ImageNet 上预训练的 ResNet50 模型。由于网络连接可能不可靠,因此将在边缘设备上进行分类。

假设我有一系列帧被检测到包含涂鸦,因为车辆经过它,但我只需要报告一个图像(因此不是所有帧都包含涂鸦)。我怎样才能做到这一点?

理想情况下,我想报告相机垂直于墙壁的框架。为什么是垂直的?我认为当相机垂直于墙壁时包含涂鸦的图像会更清楚地显示涂鸦。

1个回答

ResNet 是一种用于对象识别的架构,您可以使用它来完成分类任务。Fast RCNN 可能会改善你的结果,但它是一个更难实现的架构。如果你想朝这个方向发展,最好的起点是 Fast R-CNN 的 arxiv 论文 (arxiv.org/abs/1504.08083)。如果我没记错的话,如果你真的想要的话,pytorch 中有一个 fast-rcnn 的实现。

你似乎是深度学习的新手。我强烈建议从简单开始。ResNet-50 对于您的应用程序来说可能绰绰有余。此外,我建议使用像 fast.ai 这样的库。