Questions tagged «image-processing»

通常,图像处理是其输入为图像的任何形式的信号处理,例如照片或视频帧。

5
文字中的“河流”检测
在TeX stackexchange上,我们一直在讨论如何在此问题的段落中检测“河流” 。 在这种情况下,河流是空白区域,是文本中单词间空格的意外对齐导致的。由于这可能会使读者分心,因此糟糕的河流被认为是不良印刷的征兆。带有河流的文本的一个示例是该河流,其中有两条河流沿对角线流动。 有兴趣自动检测这些河流,以便可以避免(可能是通过手动编辑文本)。Raphink在TeX级别上取得了一些进展(仅知道字形位置和边界框),但是我有信心,检测河流的最佳方法是进行某些图像处理(因为字形形状非常重要,TeX无法使用)。 。我尝试了多种方法从上述图像中提取河流,但是我提出的应用少量椭圆形模糊的简单想法似乎还不够好。我也试过Rad基于霍夫变换的过滤,但是我也没有。河流对于人眼/视网膜/大脑的特征检测电路非常明显,因此我认为可以将其转换为某种过滤操作,但我无法使其工作。有任何想法吗? 具体来说,我正在寻找一些操作来检测上图中的2条河流,但没有太多其他误报检测。 编辑: endolith问我为什么要采用基于图像处理的方法,因为在TeX中我们可以访问字形的位置,间距等,并且使用检查实际文本的算法可能更快,更可靠。我做事的原因是形状的字形可能会影响河流的明显程度,并且在文本级别上很难考虑这种形状(取决于字体,绑扎等)。有关字形形状如何重要的示例,请考虑以下两个示例,它们之间的区别在于,我用几乎相同宽度的其他字形替换了一些字形,以便进行基于文本的分析他们同样好/坏。但是请注意,第一个示例中的河流比第二个示例中的河流差很多。

6
对于图像,频域表示什么?
我只是在学习图像的频域。 如果出现波浪,我可以理解频谱。它表示波中存在哪些频率。如果绘制频谱,则会在和处获得脉冲信号。我们可以使用相应的过滤器来提取特定信息。- ˚F + ˚Fcos(2πft)cos⁡(2πft)\cos(2\pi f t)−f−f-f+f+f+f 但是频谱在图像情况下意味着什么?当我们在OpenCV中对图像进行FFT运算时,会得到一张奇怪的图片。该图像表示什么?它的应用是什么? 我读了一些书,但它们提供了许多数学方程式,而不是物理意义。那么,谁能在图像处理中简单地应用频域的简单解释呢?




10
深度学习会杀死图像处理/计算机视觉吗?
我期待注册信号和图像处理的硕士学位,或者计算机视觉(我尚未决定),这个问题浮出水面。 我担心的是,由于深度学习不需要特征提取并且几乎不需要输入预处理,是否会破坏图像处理(或一般来说是信号处理)? 我不是深度学习专家,但是它在直接拍摄图像而不是像其他技术一样使用特征向量的识别和分类任务中似乎效果很好。 是否存在使用图像处理技术的传统特征提取+分类方法会更好的情况,还是因为深度学习而垂死?

4
OpenCV的类似库,用于音频处理/分析
我了解OpenCV是用于在C / C ++中对图像处理进行编程的事实上的库;我想知道是否有C或C ++库用于音频处理。我基本上想过滤来自麦克风的原始波,并使用一些机器学习算法对其进行分析。但我最终可能还需要: 多平台音频捕获和音频播放 DSP-音频滤波器 音调检测 音调特性分析 音调合成 识别给出一些识别语料和模型 语音/音乐合成 任何意见,将不胜感激。

6
分割树叶中的静脉的最佳方法?
我已经做了许多研究,并发现了诸如自适应阈值法,分水岭等方法,可以用于检测叶片的脉络。但是阈值化不好,因为它会引入很多噪声 我所有的图像都是灰色图像,在迫切需要帮助的同时考虑到这个问题时,任何人都可以建议采取什么方法 编辑:我的原始图片 阈值化之后 如答案所示,我已经尝试了以下边缘检测 坎尼 太多的噪音和不必要的干扰 索贝尔 罗伯茨 编辑:尝试了一次以上的操作,我得到的结果比我尝试过的精巧和适应性更好的以下结果您感觉如何?

5
点模式识别
问题有两个不同大小的点集(为简单起见为2D)散布在两个不同大小的正方形中,问题是: 1- 如何找到小到大的任何一个? 2-关于如何对出现的事件进行排名的想法,如下图所示? 这是问题的简单演示和所需的解决方案: 更新1: 下图显示了所研究问题的更实际的视图。 关于注释,以下属性适用: 点的确切位置可用 点的确切大小可用 大小可以为零(〜1)=仅一个点 所有点在白色背景上都是黑色的 没有灰度/抗锯齿效果 这是我通过endolith一些小的更改实现的方法的实现(我旋转了目标而不是源,因为它更小且旋转更快)。我接受了'endolith'的回答,因为我之前在考虑这个问题。关于RANSAC到目前为止,我还没有经验。此外,RANSAC的实现需要大量代码。


1
如何弄平食品罐上标签的图像?
我想在一罐食品上拍摄标签的图片,并能够对其进行变换,以使标签平坦,左右两侧的大小均调整为与图像中心对齐。 理想情况下,我想利用标签和背景之间的对比度来找到边缘并进行校正。否则,我可以要求用户以某种方式识别图像的角落和侧面。 我正在寻找一般技术和算法来拍摄球形偏斜(在我的情况下为圆柱形)并且可以使图像变平的图像。当前,包裹在广口瓶或瓶子上的标签图像将具有一些特征和文本,这些特征和文本在向图像的右侧或左侧后退时会缩小。同样,表示标签边缘的线将仅在图像中心平行,并且将在标签的左右两端彼此偏斜。 处理完图像后,我希望留下一个几乎完美的矩形,在该矩形上,文本和特征的大小均要统一,就像我在不在罐子或瓶子上的时候给标签拍照一样。 另外,如果该技术可以自动检测标签的边缘以应用适当的校正,我也很希望。否则,我将不得不要求我的用户指出标签边界。 我已经用Google搜索并找到了类似这样的文章: 弄平弯曲的文档,但是我正在寻找更简单的东西,因为我需要的是带有简单曲线的标签。


3
自适应阈值最常用的算法是什么?
自适应阈值已在前面几个问题中进行了讨论: 使用Matlab进行肝分割的自适应阈值 在此示例中,用于文档图像阈值处理的最佳算法是什么? 当然,有许多用于自适应阈值的算法。我想知道您发现哪些最有效和有用。 您最常使用哪种自适应算法以及针对哪种应用程序;您如何选择该算法?

7
在图像中找到正方形
我需要使用OpenCV在图像中找到正方形(在matlab或其他任何问题上都没问题,通常我期望的是一些想法)。 考虑下面的测试图像: 我需要在上面的图像中准确找到那些彩色的正方形(而不是白色的长条)。 我做了什么 : 我应用了通用方法(OpenCV样本随附),即在所有颜色平面中找到轮廓,对其进行近似并检查元素数= 4。它在某种程度上可以检测到很少的正方形,尤其是暗的正方形。 我要做的下一步是预测。即这种安排是固定的。因此,如果获得一些,我可以预测剩余的。它还可以进一步扩展。但是准确性非常差。 但是我觉得这里的预测不是一个好方法,并且它并不总是提供第一步所给出的准确答案。 我需要的 : 1)还有其他更好的方法可以更准确地检测这些正方形吗?还是多种方法? 重要的一点是,时间在这里不是问题。算法可能很慢,没关系。但是准确性是主要标准。 有时,图像可能更加模糊。 我面临的主要问题之一是某些正方形的颜色与背景颜色几乎相似(请检查第3列的第一和第二个正方形)。 寻找想法,在此先感谢 更新: 以下是我得到的最大准确结果: 当然,结果图像的大小会有所调整。 更新2: 我在下面的答案中给出了更好的解决方案:https : //dsp.stackexchange.com/a/7526/818

2
Hough变换和Radon变换之间有什么区别?
我通过学习CT扫描熟悉Radon变换,但不熟悉Hough变换。维基百科说 对于二维的一组直线,(r,θ)平面有时称为Hough空间。这种表示使霍夫变换在概念上非常接近二维Radon变换。(可以将它们视为查看同一变换的不同方法。[5]) 在我看来,它们的输出是相同的: Wolfram Alpha:Rad Wolfram Alpha:霍夫 所以我不知道有什么区别。他们只是以不同的方式看待同一件事吗?每个不同的观点有什么好处?为什么不将它们合并为“霍夫-拉登变换”?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.