Questions tagged «image-processing»

通常,图像处理是其输入为图像的任何形式的信号处理,例如照片或视频帧。


5
在此示例中,用于文档图像阈值处理的最佳算法是什么?
我正在尝试对所示图像实施各种二值化算法: 这是代码: clc; clear; x=imread('n2.jpg'); %load original image %现在我们调整图像的大小,以便以后的计算工作变得更容易。 size(x); x=imresize(x,[500 800]); figure; imshow(x); title('original image'); z=rgb2hsv(x); %extract the value part of hsv plane v=z(:,:,3); v=imadjust(v); 现在,我们找到了niblack和%sauvola算法所需的均值和标准差 m = mean(v(:)) s=std(v(:)) k=-.4; value=m+ k*s; temp=v; %实现niblack阈值算法: for p=1:1:500 for q=1:1:800 pixel=temp(p,q); if(pixel>value) temp(p,q)=1; else temp(p,q)=0; end end end figure; imshow(temp); …

5
森林图像中的检测痕迹
有谁知道有任何研究/论文/软件来识别森林场景图像中的踪迹(从直线或点对点曲线)(从沿着踪迹某处的相机的角度来看)? 我正在尝试找到一种可以拍摄像这样的图像的算法: 并制作一个遮罩,标识可能的“痕迹”,例如: 如您所见,原始图像有点模糊,这是有目的的。图像源无法保证完美对焦,因此我需要能够处理合理数量的噪点和模糊度。 我的第一个想法是应用高斯模糊,然后将图像分割为块,比较相邻块以寻找明显的色差(指示轨迹“边缘”)。但是,我很快意识到阴影和照明的其他变化很容易使它消失。 我当时正在考虑提取SURF特征,但是只有当图像完全清晰且光照一致时,SURF / SIFT才成功。 我还尝试将图像和蒙版缩放到更小的尺寸(例如100x75),将它们转换为1xN向量,并使用它们来训练基于FANN的神经网络(其中图像是输入,而蒙版是所需的蒙版)输出)。即使是这么小的尺寸,只有1个隐藏层占输入向量大小的75%,训练仍然花费了6个小时,而且仍然无法预测测试集中的任何遮罩。 有人可以针对该主题提出任何其他方法或论文吗?


5
计算机视觉的好语言?
我正在尝试实现基于内容的图像检索系统,但在此之前,我想先概述一些适合此任务的编程语言(具有良好的库等)。 有谁知道一些很好的语言和库来完成此类任务?那么Python或Java呢? 最好

4
在植物显微图像中查找气孔
这是图像处理专家的问题。 我正在研究一个困难的计算机视觉问题。任务是计算DIC显微镜图像中的气孔(如下所示)。这些图像可以抵抗大多数表面图像处理技术,例如形态学运算和边缘检测。它也不同于其他细胞计数任务。 我正在使用OpenCV。我的计划是复查潜在的有用的气孔特征。 纹理分类器 DCT(离散余弦变换/频域分析) LBP(本地二进制模式) HOG(定向梯度直方图) 强大的特征检测器(我对此表示怀疑) 哈里斯角 SIFT,SURF,STAR等 Haar级联分类器/ Viola-Jones功能 并可能设计一个新颖的特征描述符。我暂时没有选择分类器。 我错过了什么?您将如何解决?解决类似物体检测问题的方法将非常有帮助。 示例图片在这里。 带通滤波器后: Canny边缘检测前景不佳。一些图像区域不清晰:

3
如何从一组图像中重建3D结构?
我有一组以以下方式分组的轮廓(线段集): 小号一世= { 我0,我π4,我2个π4, ... ,我7个π4}小号一世={一世0,一世π4,一世2π4,…,一世7π4}S_i = \{I^0, I^\frac{\pi}{4}, I^\frac{2\pi}{4}, \ldots, I^\frac{7\pi}{4} \} 哪里 表示一个具体物体的照片序列。 小号一世小号一世S_i 表示一张图像,具有 j t h的视角( j = 0表示正视图)。 一世Ĵ一世ĴI^jĴŤ ^ hĴŤHj^{th}j = 0Ĵ=0j=0 下面是示例(后视图): 一世π一世πI^\pi 如何在给定的重建对象的3d结构?小号一世小号一世S_i 有人可以给我指出一些论文,甚至给我一些关键词吗?我知道有很多文章都是用点云计算的,依此类推,但是当我用线操作时,这些文章就不起作用了。

1
哈里斯角点检测的数学
该问题是从Stack Overflow 迁移而来的,因为可以在Signal Processing Stack Exchange上回答。 迁移 7年前。 这是哈里斯角点检测的数学表达式: 但是我有以下疑问: 和v的物理意义是什么?许多参考文献说,这是窗口w移动的幅度。那么窗口移动了多少?一个或两个像素?uuuvvvwww 窗口覆盖的像素位置上的总和是吗? 假设简单地,我(X ,ÿ )是在单个像素的强度(X ,ÿ )或在中心的窗口内的强度的总和(X ,ÿ )?w(x,y)=1w(x,y)=1w(x,y) = 1I(x,y)I(x,y)I(x,y)(x,y)(x,y)(x,y)(x,y)(x,y)(x,y) 根据Wiki,他们说图像是2D,用I表示,然后要求考虑区域,然后使用符号I (x ,y )(x,y)(x,y)(x,y)I(x,y)I(x,y)I(x,y) 我发现难以掌握数学解释。有人有主意吗?

3
如何消除运动模糊?
是否有从图像中去除运动模糊的普遍接受的方法。对于一个简单的情况,我们可以假设运动发生在一条直线上。我假设这是一个由运动估计和反卷积组成的两部分过程,但实际上是如何完成的呢?

1
各种图像重采样方法之间的实际相关区别是什么?
Mathematica的ImageResize功能支持许多重采样方法。 除了最近的邻居(双线性,双二次和双三次)(从名称中可以明显看出)之外,我对这个领域不熟悉,我迷失了。 您能否指出一些可以解释这些方法之间的基本(数学)差异的资料,特别是指出实际差异(例如,通过显示示例图像,其中方法的选择确实很重要,并引入了明显的差异)? 我没有信号处理背景,所以我希望使用“温和的”简洁的介绍:-) 我将在这里复制ImageResize那些“懒惰” 的方法列表以单击链接: “最近”最近邻居重采样 “双线性”双线性插值 “双二次”双二次样条插值 “双三次”双三次样条插值 “高斯”高斯重采样 “ Lanczos” Lanczos多元插值方法 “余弦”余弦插值 “ Hamming”凸起余弦汉明插值 “ Hann”凸余弦Hann插值 “布莱克曼”三项广义升余弦 “ Bartlett”三角形窗口插值 “康奈斯”平方韦尔奇插值 “ Welch” Welch二次插值 “ Parzen”分段三次插值 “ Kaiser”零阶修正贝塞尔插值


3
最快的距离变换算法
我正在寻找距离转换最快的可用算法。 根据此站点http://homepages.inf.ed.ac.uk/rbf/HIPR2/distance.htm,它描述了: 使用聪明的算法仅需两遍就可以更有效地计算距离变换(例如Rosenfeld和Pfaltz 1968)。 到处搜寻,我发现:“ Rosenfeld,A和Pfaltz,J.L。1968。数字图片上的距离函数。模式识别,1,33-61。” 但是我相信我们应该有一个比1968年更好,更快的算法吗?实际上,我找不到1968年的消息来源,因此非常感谢您的帮助。

4
当边缘相互接触时,如何检测不同的对象?
此问题是从Stack Overflow 迁移而来的,因为可以在Signal Processing Stack Exchange上回答。 迁移 8年前。 我需要在从相机检索的图像中找到所有轮廓。因此,我首先使用Canny边缘检测器找到边缘,然后找到轮廓。很简单 但是,我的轮廓被“合并”了。例如,在下面的图像中,我显然有4个不同的对象。边缘在某些点上略有接触,所以我得到一个大轮廓,而不是四个单独的轮廓。我尝试更改阈值,侵蚀,形态学操作和类似操作,但是边缘保持轻微接触。有没有人对如何在类似于以下图像的图像中获得单独的轮廓有任何建议?(下面的图像显然只是一个例子,我的实际图像要复杂得多,但是具有相同的基本问题)。

3
级联双二阶部分以实现高阶滤波器的工作原理?
我正在尝试实现8阶IIR滤波器,并且我阅读的每个应用笔记和教科书都说,最好将2阶以上的任何滤波器实现为二阶部分。我tf2sos在MATLAB中使用了二阶部分的系数,这与我预期的4个二阶部分的6x4系数有关。在实施为SOS之前,八阶滤波器需要存储7个先前的采样值(以及输出值)。现在,当实现为二阶部分时,流程如何从输入到输出工作,我是否仅需要存储2个先前的样本值?还是第一个滤波器的输出馈x_in入第二个滤波器,依此类推?
20 filters  filter-design  infinite-impulse-response  biquad  audio  image-processing  distance-metrics  algorithms  interpolation  audio  hardware  performance  sampling  computer-vision  dsp-core  music  frequency-spectrum  matlab  power-spectral-density  filter-design  ica  source-separation  fourier-transform  fourier-transform  sampling  bandpass  audio  algorithms  edge-detection  filters  computer-vision  stereo-vision  filters  finite-impulse-response  infinite-impulse-response  image-processing  blur  impulse-response  state-space  linear-systems  dft  floating-point  software-implementation  oscillator  matched-filter  digital-communications  digital-communications  deconvolution  continuous-signals  discrete-signals  transfer-function  image-processing  computer-vision  3d 

6
什么是Walsh-Hadamard变换?它有什么用?
我正在尝试自学有关WHT的知识,但在线上似乎没有很多很好的解释。我想我已经找到了如何计算WHT的方法,但是我实际上是在试图理解为什么WHT在图像识别领域中被认为有用。 它有什么特别之处?在经典傅立叶变换或其他小波变换中不会出现的信号中,它具有什么特性?为什么对物体识别有用指出,在这里?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.