我从事一个项目已经有一段时间了,以检测和跟踪从无人机捕获的视频中的车辆,目前,我正在使用SVM,该SVM受过从车辆和背景图像中提取的局部特征的特征包表示的训练。然后,我正在使用滑动窗口检测方法来尝试在图像中定位车辆,然后我想对其进行跟踪。问题在于,这种方法远远不够缓慢,而且我的检测器不如我希望的那样可靠,因此我得到了很多误报。
因此,我一直在考虑尝试从背景中分割汽车以找到大概位置,以便在应用分类器之前减少搜索空间,但是我不确定如何进行此操作,希望有人可以提供帮助?
此外,我一直在阅读有关使用图层进行运动分割的信息,使用光流按流模型对帧进行分割,是否有人对此方法有任何经验,如果可以的话,您是否可以提供一些输入,例如您是否认为此方法适用于我的问题。
更新:我也将这个问题发布到堆栈溢出中,并且得到了一个很好的答案,我已经实现了这个想法,并且效果很好,我正在研究除这种技术之外还使用光流技术。
以下是示例视频的两帧