人工智能 - 给定来自以 15 FPS 捕获图像的相机的图像，我们如何执行对象分类？ - 吾爱随笔录

人工智能深度学习图像识别计算机视觉

2021-10-20 12:42:52

我一直在研究香草前馈神经网络，并一直在研究卷积神经网络文献。

如果相机以每秒 15 帧的速度捕获视频，是否正在连续/迭代地训练分类模型以保持非时间延迟分类？

1个回答

根据用例，可以部署处理从逐帧分析到实时流媒体的视频模型。部署的原因将影响视频质量和预处理以及可以使用的模型的复杂性。

由于视频会导致大量数据非常迅速地堆积，因此可能会在图像分辨率和色彩质量之间做出妥协，可能会跳过帧，处理可能会离线完成，或者可能只需花费大量金钱来支付计算能力！无需赘述，不同的算法可用于检测、识别/分类和跟踪的不同任务，并且可以以不同的方式处理每个算法的输入。

本教程很好地展示了如何使用 OpenCV 从笔记本电脑网络摄像头流和预训练的 CNN 进行对象检测，它明确提到了丢帧以提高性能。

还有这篇文章很好地概述了对象检测、识别和跟踪。根据所描述的每种算法的上下文中的用例，您可以确定是否保留和处理所有帧的重要性 - 例如，请参阅背景减法部分；您可能不想冒险在没有检测到它的情况下飞过框架，更不用说对其进行分类了。

其它你可能感兴趣的问题