Questions tagged «object-recognition»

5
比例尺和旋转不变特征描述符
您是否可以列出一些比例和旋转不变特征描述符以用于特征检测。 该应用程序使用多分类器来检测无人机捕获的视频中的汽车和人。 到目前为止,我一直在研究SIFT和MSER(仿射不变)。我也看过LESH,LESH是基于局部能量模型的,但是其计算方式不是旋转不变的,我一直在尝试思考一种利用局部能量的方法来构建旋转不变的方法功能描述符,我在这里读到有哪些可以在商业应用中使用的SIFT / SURF的免费替代品?,即“如果您将方向分配给兴趣点并相应地旋转图像块,则可以免费获得旋转不变性”,但是不知道这是否可以缓解或我如何将其应用于我的问题,任何帮助都将是感谢,谢谢

2
行人计数算法
目前,我正在开发一个行人计数器项目(在Linux上使用OpenCV + QT)。我对方法的想法是: 捕捉帧 做背景扣除 清除噪音(腐蚀,膨胀) 查找blob(cvBlobslib)-前景对象 为每个Blob设置ROI,并在这些Blob中搜索行人(LBP和detectMultiScale)(以获得更好的性能) 对每个发现的行人进行嵌套的上身搜索(不确定)(可靠性更高) 如果在连续的帧(可能是3-4帧)上发现了相同的行人-将该区域添加到camshift和跟踪中-标记为行人 从下一个帧的斑点检测中排除camshift跟踪的区域 如果行人越过行号 我想检查一下我是否走对了。您对如何改善我的方法有什么建议吗?如果有人从事类似的工作,我将不胜感激有关此问题的任何有用技巧,资源(和批评)。

2
将Gabor滤镜应用于输入图像
我尝试应用具有特定比例的Gabor滤波器(根据我的lambda和sigma的值,所以它是(7x7)并针对4个方向(0,,ππ4π4\frac{\pi}{4}和3ππ2π2\frac{\pi}{2})输入灰度图像。3π43π4\frac{3\pi}{4} 在我的代码中,实现了三个步骤: 创建Gabor过滤器 读取RGB图像,然后将其转换为灰度,最后转换为两倍。 将创建的gabor应用于输入图像(在这里,我不确定我的代码是否正确,这就是为什么我需要您的意见) 1)--------------创建Gabor滤镜(大小= 7x7和4个方向) %define the five parameters theta=....; %either 0 or pi/4 or pi/2 or 3pi/4 lambda=3.5; gamma=0.3; sigma=2.8; psi=0; sigma_x = sigma; sigma_y = sigma/gamma; nstds = 5; xmax = max(abs(nstds*sigma_x*cos(theta)),abs(nstds*sigma_y*sin(theta))); xmax = ceil(max(1,xmax)); ymax = max(abs(nstds*sigma_x*sin(theta)),abs(nstds*sigma_y*cos(theta))); ymax = ceil(max(1,ymax)); xmin = -xmax; ymin = …

3
检测填充的玻璃物体
我是从stackoverflow中的这个问题发送来的,请问如果问题太具体而又不是这里的方式:) 任务是找到其中装有特定液体的玻璃。让我为您展示图片,然后在图片下方的描述中描述我正在尝试实现的目标以及到目前为止我如何尝试实现的目标。 图片:(似乎我至少需要10名信誉才能发布图片和链接,因此链接必须要做:(否则,您可以查看堆栈溢出问题) 详细说明:我正在尝试实现一种算法,该算法将在opencv中检测特定形状的玻璃(玻璃可能会因不同的镜头拍摄角度/距离而发生变形)。也将有其他形状的其他眼镜。我要搜索的玻璃杯中还将填充一些有色液体,这将使其与包含其他颜色的玻璃杯区分开。 到目前为止,我已经尝试使用SIFT特征提取器尝试在玻璃中找到某些特征,然后将它们与装有玻璃的其他照片进行匹配。 这种方法仅在非常特殊的条件下才有效,在这种情况下,我会将玻璃放置在非常特定的位置,并且背景类似于学习图像。问题还在于,玻璃是3D对象,我不知道如何从中提取特征(也许是多张照片以不同的方式链接在一起?)。 现在我不知道我还能使用什么其他方法。我已经找到了一些线索(在这里/programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338),但链接似乎已断开。 另一个问题是在这种玻璃杯中检测不同的“空度”,但我什至无法正确找到玻璃杯本身。 您对本任务中的方法有何建议?使用其他方式查找本地3d对象特征会更好吗?还是完全使用其他方法会更好?我听说过算法从一组多张照片中“学习”对象,但实际上我从未见过。 任何建议将不胜感激

1
去除牙科放射线照相中的噪声
我正在开展一个应用Active Shape Model 在牙科X射线照片中定位牙齿的项目。对于那些熟悉这项技术的人,我目前正在尝试沿着每个界标的法线矢量进行采样。该论文建议采用采样像素的导数:“为减少全局强度变化的影响,我们沿轮廓而非绝对灰度值采样导数。” 因此,我的问题是如何以最佳方式过滤牙科X光片,以准备应用导数算子。我目前正在使用中值滤波器的组合来消除我认为是量子噪声(杂色)的大部分。其次是双边过滤器。然后,我应用Scharr运算符来计算应采样的实际梯度。 结果如下: 第一张图片显示原始数据。在第二张和第三张图像中,显示了滤波后的数据,首先显示为FFT后的频谱幅度,然后显示为滤波后的图像数据。第四张图片显示了将Scharr运算符应用于第三张图片的结果。 我的问题是: 有没有一种与我的方法不同的减少牙齿X光片噪声的方法? 是什么导致边缘和“平坦”(非边缘)区域的“烟熏”外观?是滤波图像中的某种残留噪声还是梯度算子固有的?如果确实是噪音,那么哪个滤波器最适合使用?中值滤镜可以很好地去除较小的噪点斑点,但较大的内核会导致边缘模糊太多。因此,双边滤镜用于滤除较大的斑点,并在不损害边缘的情况下使整个区域的颜色均匀,但是无法滤除这种烟熏结构。 在这种情况下,是否有比Scharr运算符更好的选项来创建渐变? 好处:这将被视为Active Shape Model的良好输入吗?我还不知道它们有多强大。

1
车辆细分和跟踪
我从事一个项目已经有一段时间了,以检测和跟踪从无人机捕获的视频中的车辆,目前,我正在使用SVM,该SVM受过从车辆和背景图像中提取的局部特征的特征包表示的训练。然后,我正在使用滑动窗口检测方法来尝试在图像中定位车辆,然后我想对其进行跟踪。问题在于,这种方法远远不够缓慢,而且我的检测器不如我希望的那样可靠,因此我得到了很多误报。 因此,我一直在考虑尝试从背景中分割汽车以找到大概位置,以便在应用分类器之前减少搜索空间,但是我不确定如何进行此操作,希望有人可以提供帮助? 此外,我一直在阅读有关使用图层进行运动分割的信息,使用光流按流模型对帧进行分割,是否有人对此方法有任何经验,如果可以的话,您是否可以提供一些输入,例如您是否认为此方法适用于我的问题。 更新:我也将这个问题发布到堆栈溢出中,并且得到了一个很好的答案,我已经实现了这个想法,并且效果很好,我正在研究除这种技术之外还使用光流技术。 以下是示例视频的两帧 框架0: 框架5:

1
识别图像中汽车模型的良好功能/算法
我有一个关于物体识别的问题,尤其是识别汽车模型!我正开始着手在不同图像中识别相同汽车模型的工作。目前,我认为3D对象识别的最佳算法之一是SIFT,但在演示实现中反复试验后,我感到奇怪的是,该算法在有光泽的金属物体(例如汽车)上存在一些问题,尤其是当它们具有不同的颜色时。 有谁知道这个领域的一些工作,总的来说是一些合适的算法,可以在不同的图像中找到相同的汽车模型? 在此先感谢您的帮助!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.