我正在研究在一个长的(15 分钟的序列)中识别一个小视频序列(18 秒的序列)的想法,想到的第一个想法是我必须用一些来描述这个小视频种识别。
所以我会用标识来看看长序列里面的这个小序列。
我正在向社区提出这个问题,与我分享一种方法,可以帮助我描述这个小视频,然后在长序列中识别它。
我正在研究在一个长的(15 分钟的序列)中识别一个小视频序列(18 秒的序列)的想法,想到的第一个想法是我必须用一些来描述这个小视频种识别。
所以我会用标识来看看长序列里面的这个小序列。
我正在向社区提出这个问题,与我分享一种方法,可以帮助我描述这个小视频,然后在长序列中识别它。
这里最直观的方法就是获取每个像素的颜色值,并在各个像素的参考视频/短视频互相关函数中找到峰值。这基本上是一个 W×H 维的互相关函数;你可以通过快速卷积来加快速度。
您可以通过首先减少问题的维度来通过算法减少工作量,例如通过将每个视频帧减少到全局亮度值和例如帧中心区域的平均运动矢量 - 然后您只需要计算三维互相关功能。