我有来自固定(固定)相机的视频。有时帧中有轻微的移动(例如,树在风中移动了一点)。其他时候,有些人可能会走进相机的视野,一只鸟可能会飞过,等等。
我可以建立一个分类器来检测鸟类和人......但我不知道相机会拾取什么。我知道诸如imageNet和YOLO之类的模型,但我不想对帧中可能出现的内容做出假设(颜色、形状、大小、类型等)。
因此,我正在寻找一种方法来检测视频中的任意对象(即相对于图像的其余部分移动的任何对象)并跟踪它们。分类可以在以后进行。
有哪些方法可以解决这个问题?我将用 Python 编写。