Questions tagged «image-processing»

通常,图像处理是其输入为图像的任何形式的信号处理,例如照片或视频帧。

5
用于图像下采样的低通滤波器参数
我需要按水平和垂直(, <)的缩小图像。s y s x s y 1sXsxs_xsÿsÿs_ysXsXs_xsÿsÿs_y1个1个1 我想在下采样之前使用有限的低通滤波器。n × 米ñ×米n\times m 我应该如何确定低通滤波器参数(和高斯)以将其作为和的函数?σ 小号X 小号ÿÑ ,米ñ,米n, mσσ\sigmasXsXs_xsÿsÿs_y 具体来说,在的情况下,我很有趣。sX= 秒ÿ= 1 / 2–√sX=sÿ=1个/2s_x=s_y=1/\sqrt{2}

2
分割半透明的材料,例如玻璃
我完全陷入关于玻璃物体分割的问题。我需要使对象尽可能精确。我的方法是不同的。首先,我尝试删除背景,以便仅保留一些清晰的轮廓。但这仅适用于具有尖锐边缘/渐变的对象。否则,对象本身也将被删除。我张贴了两个不同的图像。 我试图通过形态学操作(例如灰度膨胀和其上的分界线)去除背景。但这并没有太大帮助。之后,我尝试使用k = 3的k均值来使修改后的背景与玻璃的灰度和黑色值分开。在某些情况下,这并不成功,但总体/平均而言却并非如此。我还尝试使用整体模糊的滤镜进行Canny边缘检测,但这导致以开放轮廓,大量噪点等形式出现的结果较弱。 Canny具有自动阈值结果: testimg = imread('http://i.imgur.com/huQVt.png'); imshow(testimg) imedges = edge(testimg,'canny'); imshow(imedges); 第二张图片也一样。 如您所见,玻璃内部和外部都有大量噪声,并且玻璃边缘的边缘加倍。即使边缘有缝隙。 因此,我需要您的建议以获取一种通用的方法来处理半透明材料的问题,而不仅仅是这两个图像。 1)在不损坏对象的情况下移除背景的其他想法? 2)其他使对象与背景分离的分割方法? 如果可能,则使用Matlab,IPT或统计工具箱提示。任何其他提示也欢迎! 谢谢您的提前答复。真诚的

1
使用Matlab进行肝分割的自适应阈值
我需要使用自适应阈值技术从腹部CT图像中分割肝脏。但是我将整个前景与背景分开了。我只需要分离前景的肝脏部分。在http://www.ijcaonline.org/casct/number1/SPE34T.pdf中查看pdf文件。 我需要一个类似于图6所示的输出。 我在这里附上我的编码。请帮我。 %testadaptivethresh.m clear;close all; im1=imread('nfliver2.jpg'); bwim1=adaptivethreshold(im1,11,0.03,0); figure,imshow(im1); figure,imshow(bwim1); imwrite(bwim1,'at2.jpg'); function bw=adaptivethreshold(IM,ws,C,tm) %ADAPTIVETHRESHOLD An adaptive thresholding algorithm that seperates the %foreground from the background with nonuniform illumination. % bw=adaptivethreshold(IM,ws,C) outputs a binary image bw with the local % threshold mean-C or median-C to the image IM. % ws is …

2
Photoshop“黑白”调整层背后的算法是什么?
有人可以解释一下photoshop中“黑白”调整层背后的算法吗? 对于必须强调图像中非红色/品红色像素(具有类似百分比的可配置公差)的应用程序,我必须使用C ++对其进行重现,并且该资源显示了我所期望的行为。 仍然无法复制它,但是我找到了一个线索: 每个像素最多由两个控件定义,一个为加法(RGB),一个为减法(CMY)。


4
卷积如何表示为矩阵乘法(矩阵形式)?
我知道这个问题可能与编程无关,但是如果我不了解图像处理背后的理论,那么我将永远无法在实践中实现某些功能。 如果我做对的话,高斯滤波器会与图像卷积以减少噪声,因为它们可以计算像素邻域的加权平均值,并且在边缘检测中非常有用,因为您可以应用模糊并同时得出图像只需与高斯函数的导数卷积即可。 但是,谁能给我解释一下,或者给我一些有关它们如何计算的参考呢? 例如,Canny的边缘检测器谈论的是5x5高斯滤波器,但是他们如何获得这些特定的数字呢?以及它们如何从连续卷积变为矩阵乘法?

3
了解YCbCr颜色空间中的Cb和Cr成分
我熟悉加性(RGB),次主色(CMYK)和类似HSV的色彩空间,但是我目前试图理解的一篇文章在YCbCr色彩空间上进行图像分割/对象定义。 我整个上午都在寻找可以自然解释YCbCr的东西,但我却一无所获。我有一个不错的直观解释该色彩空间背后的总体思路 这里,和它是如何用于图像编码的/压缩的解释,这些 人(全部在photo.SE)。 从RGB计算YCbCr的公式很容易在维基百科上找到。 我得到了这种表示的动力,我得到了Y分量包含有关图像的最重要的(对于人眼而言)灰度信息。 我知道Cb和Cr带有关于颜色的信息,并且(由于人眼的敏感性)可以压缩它们,而看不到质量的损失。但是,每个色度分量实际上代表什么? 正如文章作者提到的那样,“色度信息在对象定义中至关重要”,而我目前的“ Y是强度,Cb和Cr某种程度上承载了颜色信息”水平,我无法完全理解我正在阅读的内容。了解YCbCr。 我正在寻找“ Cb是...,而Cr是...”或“如果您想通过XY查看/实际上是在查看Cb成分...”的答案,或者另一种可以帮助我理解每个组件分别承载的信息的方法,而不仅仅是它们一起承载了颜色信息。 编辑 让我举例说明我正在寻找的其他颜色空间的直观解释: RGB:就像在黑色的墙壁上照耀着彩色的手电筒一样:如果您用蓝色的手电筒照亮,则会看到蓝色的反射。如果添加红色手电筒,它将显示品红色反射,是蓝色和红色的混合物。 CMYK:就像混合水彩画一样,您“添加表面反射的颜色”(即从背景中减去颜色),因此,如果将黄色和青色混合在一起,则将反射绿色,从而得到绿色。 HSV:小孩被高度饱和的物体所吸引,而不是明亮的(有价值的)物体。色相成分是“赋予颜色”的成分,而低饱和度意味着颜色被白色“稀释”。价值的变化使整个事物变得更亮或更暗。 有了这些定义,我就可以直观地了解每个颜色空间中的颜色表示的含义,而无需记住每个图表的颜色。

2
高斯,拉普拉斯和墨西哥帽小波之差有什么区别?
简历中使用了三种技术,它们看起来非常相似,但有细微的差别: 高斯的拉普拉斯算子:∇2[g(x ,y,t )∗ f(x ,y)]∇2[g(x,y,t)∗f(x,y)]\nabla^2\left[g(x,y,t)\ast f(x,y)\right] 高斯差异:[ 克1个(x ,y,t )∗ f(x ,y)] - [ g2(x ,y,t )∗ f(x ,y)][g1(x,y,t)∗f(x,y)]−[g2(x,y,t)∗f(x,y)] \left[g_1(x,y,t)\ast f(x,y)\right] - \left[g_2(x,y,t)\ast f(x,y)\right] 用Ricker小波进行卷积:里克(x ,y,t )∗ f(x ,y)Ricker(x,y,t)∗f(x,y)\textrm{Ricker}(x,y,t)\ast f(x,y) 据我目前了解:DoG是LoG的近似值。两者都用于斑点检测,并且两者本质上都充当带通滤波器。用墨西哥帽/里克小波进行卷积似乎可以达到几乎相同的效果。 我已将所有三种技术应用于脉冲信号(必须进行缩放以使幅度相似),结果非常接近。实际上,LoG和Ricker看起来几乎相同。我注意到的唯一真正的区别是使用DoG,我有2个免费的参数可以进行调整(和),而LoG和Ricker则为1。我还发现小波是最简单/最快的,因为它可以通过一次卷积(通过傅立叶空间乘以核的FT乘以完成)对DoG进行2次,对卷积进行卷积加Laplacian进行。 σ 1σ1个σ1\sigma_1σ1个σ1\sigma_1 每种技术的比较优点/缺点是什么? 有不同的用例,其中一个优于另一个吗? 我还凭直觉想到,在离散样本上,LoG和Ricker会退化为相同的操作,因为可以实现为内核 。[ - 1 ,2 ,- 1 ]∇2∇2\nabla^2[ − 1 ,2 ,− 1]要么⎡⎣⎢0− …

2
图像处理-核计数
我正在尝试创建一个可以计算此类图像中核数的程序: 我已经完成的步骤如下: 应用交替顺序滤镜(使用逐渐变大的结构元素关闭和打开图像) 应用距离变换 使用距离变换图像应用分水岭分割以检测最小值 产生以下结果(其中每种颜色代表计数的新核): 如我们所见,存在很多缺陷,特别是原子核过多。我想说这个问题的原因是我对分水岭变换(使用距离变换)施加最小值的方式,但是在这种情况下,我确实没有其他施加最小值的想法。 由于距离变换会根据对象的圆度生成最小值,因此我想知道一种比“交替序列滤波器”更好的将原子四舍五入的替代方法(查看上图,我们可以推断出大多数“超计数”来自不太圆的核)。我还想知道为分水岭变换施加最小值的更好方法。

3
检测填充的玻璃物体
我是从stackoverflow中的这个问题发送来的,请问如果问题太具体而又不是这里的方式:) 任务是找到其中装有特定液体的玻璃。让我为您展示图片,然后在图片下方的描述中描述我正在尝试实现的目标以及到目前为止我如何尝试实现的目标。 图片:(似乎我至少需要10名信誉才能发布图片和链接,因此链接必须要做:(否则,您可以查看堆栈溢出问题) 详细说明:我正在尝试实现一种算法,该算法将在opencv中检测特定形状的玻璃(玻璃可能会因不同的镜头拍摄角度/距离而发生变形)。也将有其他形状的其他眼镜。我要搜索的玻璃杯中还将填充一些有色液体,这将使其与包含其他颜色的玻璃杯区分开。 到目前为止,我已经尝试使用SIFT特征提取器尝试在玻璃中找到某些特征,然后将它们与装有玻璃的其他照片进行匹配。 这种方法仅在非常特殊的条件下才有效,在这种情况下,我会将玻璃放置在非常特定的位置,并且背景类似于学习图像。问题还在于,玻璃是3D对象,我不知道如何从中提取特征(也许是多张照片以不同的方式链接在一起?)。 现在我不知道我还能使用什么其他方法。我已经找到了一些线索(在这里/programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338),但链接似乎已断开。 另一个问题是在这种玻璃杯中检测不同的“空度”,但我什至无法正确找到玻璃杯本身。 您对本任务中的方法有何建议?使用其他方式查找本地3d对象特征会更好吗?还是完全使用其他方法会更好?我听说过算法从一组多张照片中“学习”对象,但实际上我从未见过。 任何建议将不胜感激




1
为在CT重建体积中检测解剖标志提供建议
我试图在CT重建体积中自动检测一些医学定义的解剖标志。医生使用这些界标来测量某些患者特定参数。我试图使用SIFT特征描述符,因为这些解剖标志是“关键点”。由于地标是通常不是SIFT定义的“兴趣点”的点(或微小区域),因此效果不是很好。我一直在寻找许多模式/模板匹配算法,但是,当我没有旋转/平移/缩放问题时,我发现提取的特征不能将每个界标的区别都足够大(与其余界标以及与非界标的其余部分区别开)地标补丁)以训练性能足够好的分类器(至少80%的检测精度)。 如果我没有足够清楚地说明问题,请告诉我。 我真的很感谢任何建议。 谢谢! 示例图片: 我想要检测的地标上有小x叉和小方块(我忘了提到我有训练集,带有标记的地标)。白线代表已采取的措施。这些是不同情况的一些片段(当然,我无法发布完整的3D卷)。

2
关于时频图像的去噪
我想知道什么样的技术可以用来“ 消噪 ”以下使用Welch方法创建的示例时频图像。下图是从机器人传感器创建的。(这不是彩色图像-它是灰度图像-添加的颜色仅用于视觉目的)。 目标: 我的目标是最终估计存在这种脉冲时在此处看到的脉冲间隔。这可能有点像鸡和鸡蛋,所以为此,我问自己:“是否存在这种重复率+/- 10%的脉冲?”,然后继续进行检测。您在这里看到的是信号(脉冲),但还有其他不需要的干扰。然而,正如埃姆雷(Emre)所建议的那样,它们具有结构,尽管在时空空间中也是如此。是否存在这样的时频滤波器? 我非常希望看到此处应用了图像处理解决方案,但欢迎任何解决方案。 因此:目的是去除可见的所有高强度信号,除了重复脉冲(在y轴的索引300附近)。所有其他高强度信号都可以视为“干扰”。 您可能做出的假设: 您可能假设您大致知道在这里看到的脉冲长度。(让我们说,在+/- 10%以内)。换句话说,您已决定寻找这种长度的脉冲。(+/-) 您可能假设您也大致了解了脉冲的重复率(再次,让我们说+/- 10%)。 不幸的是,您不知道它们的频率。也就是说,在此图像中,脉冲为300,但是它们很容易达到100、50、489。但是,好消息是,此处显示的那些频率彼此非常接近,大约为10赫兹。 我的一些想法: 图像处理POV: 我进行了形态学操作,但是我对那些操作员不太熟悉,不知道它们是否可行。我想这个想法可能是“关闭”并因此去除“更大”的污渍? 行扫描DFT操作可能会根据感兴趣的行具有最高的重复模式来指示要清空的行,但是,如果脉冲很少且相距较远,或者如果图像噪声较大,则可能不是可行的解决方案。 仅通过查看图像,您几乎就想“奖励”隔离和“惩罚”连通性。是否存在可以完成此类操作的图像处理方法?(再次是形态上的)。 哪些方法可以帮助您? 信号处理POV: 此处显示的频率范围已经非常狭窄,因此我不确定陷波滤波操作是否会有所帮助。此外,在这个狭窄范围内显示的脉冲的确切频率是先验的。 通过对此处感兴趣的脉冲进行有根据的猜测,(它们的长度和重复时间)也许可以计算出我的“模板” 的二维DFT,并将其用作二维倒谱时间滤波器,我只需将上面显示的Welch图像乘以,然后执行反二维DFT? OTOH也许Gabor过滤器在这里会是一个很好的选择吗?毕竟,它们是方向敏感的过滤器,类似于我们自己的内置V1视觉处理器。在这里如何利用它们? 哪些方法可以在此领域提供帮助? 提前致谢。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.