给定来自以 15 FPS 捕获图像的相机的图像,我们如何执行对象分类?

人工智能 深度学习 图像识别 计算机视觉
2021-10-20 12:42:52

我一直在研究香草前馈神经网络,并一直在研究卷积神经网络文献。

如果相机以每秒 15 帧的速度捕获视频,是否正在连续/迭代地训练分类模型以保持非时间延迟分类?

1个回答

根据用例,可以部署处理从逐帧分析到实时流媒体的视频模型。部署的原因将影响视频质量和预处理以及可以使用的模型的复杂性。

由于视频会导致大量数据非常迅速地堆积,因此可能会在图像分辨率和色彩质量之间做出妥协,可能会跳过帧,处理可能会离线完成,或者可能只需花费大量金钱来支付计算能力!无需赘述,不同的算法可用于检测、识别/分类和跟踪的不同任务,并且可以以不同的方式处理每个算法的输入。

教程很好地展示了如何使用 OpenCV 从笔记本电脑网络摄像头流和预训练的 CNN 进行对象检测,它明确提到了丢帧以提高性能。

还有这篇文章很好地概述了对象检测、识别和跟踪。根据所描述的每种算法的上下文中的用例,您可以确定是否保留和处理所有帧的重要性 - 例如,请参阅背景减法部分;您可能不想冒险在没有检测到它的情况下飞过框架,更不用说对其进行分类了。