Questions tagged «computer-vision»

计算机视觉包括处理,分析,图像和高维数据以形成对场景或图像的高级理解和识别的方法。



10
深度学习会杀死图像处理/计算机视觉吗?
我期待注册信号和图像处理的硕士学位,或者计算机视觉(我尚未决定),这个问题浮出水面。 我担心的是,由于深度学习不需要特征提取并且几乎不需要输入预处理,是否会破坏图像处理(或一般来说是信号处理)? 我不是深度学习专家,但是它在直接拍摄图像而不是像其他技术一样使用特征向量的识别和分类任务中似乎效果很好。 是否存在使用图像处理技术的传统特征提取+分类方法会更好的情况,还是因为深度学习而垂死?

6
分割树叶中的静脉的最佳方法?
我已经做了许多研究,并发现了诸如自适应阈值法,分水岭等方法,可以用于检测叶片的脉络。但是阈值化不好,因为它会引入很多噪声 我所有的图像都是灰色图像,在迫切需要帮助的同时考虑到这个问题时,任何人都可以建议采取什么方法 编辑:我的原始图片 阈值化之后 如答案所示,我已经尝试了以下边缘检测 坎尼 太多的噪音和不必要的干扰 索贝尔 罗伯茨 编辑:尝试了一次以上的操作,我得到的结果比我尝试过的精巧和适应性更好的以下结果您感觉如何?

5
点模式识别
问题有两个不同大小的点集(为简单起见为2D)散布在两个不同大小的正方形中,问题是: 1- 如何找到小到大的任何一个? 2-关于如何对出现的事件进行排名的想法,如下图所示? 这是问题的简单演示和所需的解决方案: 更新1: 下图显示了所研究问题的更实际的视图。 关于注释,以下属性适用: 点的确切位置可用 点的确切大小可用 大小可以为零(〜1)=仅一个点 所有点在白色背景上都是黑色的 没有灰度/抗锯齿效果 这是我通过endolith一些小的更改实现的方法的实现(我旋转了目标而不是源,因为它更小且旋转更快)。我接受了'endolith'的回答,因为我之前在考虑这个问题。关于RANSAC到目前为止,我还没有经验。此外,RANSAC的实现需要大量代码。


1
如何弄平食品罐上标签的图像?
我想在一罐食品上拍摄标签的图片,并能够对其进行变换,以使标签平坦,左右两侧的大小均调整为与图像中心对齐。 理想情况下,我想利用标签和背景之间的对比度来找到边缘并进行校正。否则,我可以要求用户以某种方式识别图像的角落和侧面。 我正在寻找一般技术和算法来拍摄球形偏斜(在我的情况下为圆柱形)并且可以使图像变平的图像。当前,包裹在广口瓶或瓶子上的标签图像将具有一些特征和文本,这些特征和文本在向图像的右侧或左侧后退时会缩小。同样,表示标签边缘的线将仅在图像中心平行,并且将在标签的左右两端彼此偏斜。 处理完图像后,我希望留下一个几乎完美的矩形,在该矩形上,文本和特征的大小均要统一,就像我在不在罐子或瓶子上的时候给标签拍照一样。 另外,如果该技术可以自动检测标签的边缘以应用适当的校正,我也很希望。否则,我将不得不要求我的用户指出标签边界。 我已经用Google搜索并找到了类似这样的文章: 弄平弯曲的文档,但是我正在寻找更简单的东西,因为我需要的是带有简单曲线的标签。

7
在图像中找到正方形
我需要使用OpenCV在图像中找到正方形(在matlab或其他任何问题上都没问题,通常我期望的是一些想法)。 考虑下面的测试图像: 我需要在上面的图像中准确找到那些彩色的正方形(而不是白色的长条)。 我做了什么 : 我应用了通用方法(OpenCV样本随附),即在所有颜色平面中找到轮廓,对其进行近似并检查元素数= 4。它在某种程度上可以检测到很少的正方形,尤其是暗的正方形。 我要做的下一步是预测。即这种安排是固定的。因此,如果获得一些,我可以预测剩余的。它还可以进一步扩展。但是准确性非常差。 但是我觉得这里的预测不是一个好方法,并且它并不总是提供第一步所给出的准确答案。 我需要的 : 1)还有其他更好的方法可以更准确地检测这些正方形吗?还是多种方法? 重要的一点是,时间在这里不是问题。算法可能很慢,没关系。但是准确性是主要标准。 有时,图像可能更加模糊。 我面临的主要问题之一是某些正方形的颜色与背景颜色几乎相似(请检查第3列的第一和第二个正方形)。 寻找想法,在此先感谢 更新: 以下是我得到的最大准确结果: 当然,结果图像的大小会有所调整。 更新2: 我在下面的答案中给出了更好的解决方案:https : //dsp.stackexchange.com/a/7526/818

2
Hough变换和Radon变换之间有什么区别?
我通过学习CT扫描熟悉Radon变换,但不熟悉Hough变换。维基百科说 对于二维的一组直线,(r,θ)平面有时称为Hough空间。这种表示使霍夫变换在概念上非常接近二维Radon变换。(可以将它们视为查看同一变换的不同方法。[5]) 在我看来,它们的输出是相同的: Wolfram Alpha:Rad Wolfram Alpha:霍夫 所以我不知道有什么区别。他们只是以不同的方式看待同一件事吗?每个不同的观点有什么好处?为什么不将它们合并为“霍夫-拉登变换”?

5
森林图像中的检测痕迹
有谁知道有任何研究/论文/软件来识别森林场景图像中的踪迹(从直线或点对点曲线)(从沿着踪迹某处的相机的角度来看)? 我正在尝试找到一种可以拍摄像这样的图像的算法: 并制作一个遮罩,标识可能的“痕迹”,例如: 如您所见,原始图像有点模糊,这是有目的的。图像源无法保证完美对焦,因此我需要能够处理合理数量的噪点和模糊度。 我的第一个想法是应用高斯模糊,然后将图像分割为块,比较相邻块以寻找明显的色差(指示轨迹“边缘”)。但是,我很快意识到阴影和照明的其他变化很容易使它消失。 我当时正在考虑提取SURF特征,但是只有当图像完全清晰且光照一致时,SURF / SIFT才成功。 我还尝试将图像和蒙版缩放到更小的尺寸(例如100x75),将它们转换为1xN向量,并使用它们来训练基于FANN的神经网络(其中图像是输入,而蒙版是所需的蒙版)输出)。即使是这么小的尺寸,只有1个隐藏层占输入向量大小的75%,训练仍然花费了6个小时,而且仍然无法预测测试集中的任何遮罩。 有人可以针对该主题提出任何其他方法或论文吗?

5
计算机视觉的好语言?
我正在尝试实现基于内容的图像检索系统,但在此之前,我想先概述一些适合此任务的编程语言(具有良好的库等)。 有谁知道一些很好的语言和库来完成此类任务?那么Python或Java呢? 最好

3
如何在航空影像中找到网球场
我有兴趣在我县找到所有的网球场(以及其他类似的定义良好的功能,例如篮球场),而且我的航空影像具有良好的(但变化的)分辨率,但是我不确定找到它们的最佳方法。这是图像的两个示例: 我已经研究了各种方法,并且我认为模板匹配将不起作用,因为它会非常慢,因为可以任意缩放和旋转,而且颜色也会变化。该Hough变换声音许诺,但一旦我得到的所有行我不知道如何找到构成与适当比例的矩形(大概36x29英尺)线,或更好,但考虑到对其他标线。 对于背景,我的目标是将我县的所有网球场添加到OpenStreetMap中。

4
在植物显微图像中查找气孔
这是图像处理专家的问题。 我正在研究一个困难的计算机视觉问题。任务是计算DIC显微镜图像中的气孔(如下所示)。这些图像可以抵抗大多数表面图像处理技术,例如形态学运算和边缘检测。它也不同于其他细胞计数任务。 我正在使用OpenCV。我的计划是复查潜在的有用的气孔特征。 纹理分类器 DCT(离散余弦变换/频域分析) LBP(本地二进制模式) HOG(定向梯度直方图) 强大的特征检测器(我对此表示怀疑) 哈里斯角 SIFT,SURF,STAR等 Haar级联分类器/ Viola-Jones功能 并可能设计一个新颖的特征描述符。我暂时没有选择分类器。 我错过了什么?您将如何解决?解决类似物体检测问题的方法将非常有帮助。 示例图片在这里。 带通滤波器后: Canny边缘检测前景不佳。一些图像区域不清晰:

8
计算机立体视觉技术是否适合亚毫米测量?
我有一个项目,我想成像一个对象并能够将图像中特征的高度导出到亚毫米级的精度(确切的精度还有待确定,但现在可以说是百分之一毫米) 。 以前我曾被告知直接激光测距技术不适合 行程时间将太短,因此需要太多的精度才能进行精确的计算 轻微振动(例如有人走到仪器附近)会干扰结果 我观察到一种激光设备的售价约为1000美元,可以达到精度,但会遇到振动问题(很好,将设备机械隔离是另外一个讨论)。 我希望获得一个更具成本效益的结果,并考虑将立体视觉作为替代方案。作为该领域的新手,我不确定是否可以达到所需的精度。 理论上是否可以(至少)达到所需的精度? 是否有推荐的论文或资源可以帮助您进一步解释该主题? 附加条款 有问题的物体的范围从大约1/2“平方到大约2 1/2”平方,有时厚度很小(1/16“?)。大部分表面应该是平坦的,尽管一项测试可以是要确认该断言。功能将相当粗糙(通常是尖锐过渡)。8月17日11:00 “较难”的有趣物体之一约为20毫米见方,高1.25毫米。我估计的相关表面特征约为.1-.3mm。摄像头的位置可能在上面的6“左右。这是否可以让您更好地了解?8月17日15:15 我不是要执行单个轮廓/浮雕测量,而是要生成对象的表面高度图。物体的表面特征以及整体轮廓非常重要。

3
如何从一组图像中重建3D结构?
我有一组以以下方式分组的轮廓(线段集): 小号一世= { 我0,我π4,我2个π4, ... ,我7个π4}小号一世={一世0,一世π4,一世2π4,…,一世7π4}S_i = \{I^0, I^\frac{\pi}{4}, I^\frac{2\pi}{4}, \ldots, I^\frac{7\pi}{4} \} 哪里 表示一个具体物体的照片序列。 小号一世小号一世S_i 表示一张图像,具有 j t h的视角( j = 0表示正视图)。 一世Ĵ一世ĴI^jĴŤ ^ hĴŤHj^{th}j = 0Ĵ=0j=0 下面是示例(后视图): 一世π一世πI^\pi 如何在给定的重建对象的3d结构?小号一世小号一世S_i 有人可以给我指出一些论文,甚至给我一些关键词吗?我知道有很多文章都是用点云计算的,依此类推,但是当我用线操作时,这些文章就不起作用了。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.