Questions tagged «image-processing»

通常,图像处理是其输入为图像的任何形式的信号处理,例如照片或视频帧。

2
过滤某种“半色调”图像以进行OCR处理
我有一个扫描的PDF资料,要向其中添加隐藏的文字层,因此可以对文档建立索引。我使用了ghostscript黑白tiff输出设备(tiffg4)将页面提取为tiff图像,下面是它们的外观示例: 用tesseract处理此图像不会产生良好的结果。 更改ghostscript输出DPI(600、300、150、96)表明,在96 DPI下的图像可从tesseract获得最佳效果,但仍不令人满意。 现在我想征求意见,哪种过滤器可以增强此图像的OCR处理能力。 我可以使用imagemagick或numpy / scipy / ndimage

1
去除牙科放射线照相中的噪声
我正在开展一个应用Active Shape Model 在牙科X射线照片中定位牙齿的项目。对于那些熟悉这项技术的人,我目前正在尝试沿着每个界标的法线矢量进行采样。该论文建议采用采样像素的导数:“为减少全局强度变化的影响,我们沿轮廓而非绝对灰度值采样导数。” 因此,我的问题是如何以最佳方式过滤牙科X光片,以准备应用导数算子。我目前正在使用中值滤波器的组合来消除我认为是量子噪声(杂色)的大部分。其次是双边过滤器。然后,我应用Scharr运算符来计算应采样的实际梯度。 结果如下: 第一张图片显示原始数据。在第二张和第三张图像中,显示了滤波后的数据,首先显示为FFT后的频谱幅度,然后显示为滤波后的图像数据。第四张图片显示了将Scharr运算符应用于第三张图片的结果。 我的问题是: 有没有一种与我的方法不同的减少牙齿X光片噪声的方法? 是什么导致边缘和“平坦”(非边缘)区域的“烟熏”外观?是滤波图像中的某种残留噪声还是梯度算子固有的?如果确实是噪音,那么哪个滤波器最适合使用?中值滤镜可以很好地去除较小的噪点斑点,但较大的内核会导致边缘模糊太多。因此,双边滤镜用于滤除较大的斑点,并在不损害边缘的情况下使整个区域的颜色均匀,但是无法滤除这种烟熏结构。 在这种情况下,是否有比Scharr运算符更好的选项来创建渐变? 好处:这将被视为Active Shape Model的良好输入吗?我还不知道它们有多强大。



1
从太空探测器图像中删除伪像
这是我们的家庭世界的照片,最近由朱诺(Juno)太空船拍摄,在飞向木星的途中被弹射。速度的提高,我们迷失了,但值得庆幸的是,我们不会掉入阳光下。 我认为南美大陆在左边。 但是,我们可以注意到图像上存在某种伪像,图像上存在一种模糊的蓝色条。我对可能是什么原因感到好奇。 我真正想知道的是,为数不多的人类可能会使用什么图像处理技术来消除这种伪影?

2
了解SURF特征计算过程
因此,我正在阅读有关SURF的论文(Bay,Ess,Tuytelaars,Van Gool:加速鲁棒功能(SURF)),而我无法理解以下段落: 由于使用了框式滤镜和积分图像,因此我们不必将相同的滤镜迭代地应用于先前已滤过图层的输出,而是可以将完全相同速度的任何大小的框式滤镜直接应用于原始图像,并且即使是并行的(尽管此处未利用后者)。因此,通过扩大滤波器的大小而不是迭代地减小图像的大小来分析缩放空间,如图4所示。 This is figure 4 in question. PS:本文对整体图像进行了解释,但是本文的全部内容基于上面的特定段落。如果有人阅读了本文,您能否简要介绍一下这里发生的事情。整个数学解释都很复杂,需要首先掌握,因此我需要一些帮助。谢谢。 编辑,几个问题: 1。 每个八度细分为恒定数量的音阶。由于积分图像的离散性,两个后续比例之间的最小比例差异取决于部分二阶导数在导数方向(x或y)上正负叶的长度lo,将其设置为过滤器尺寸长度的三分之一。对于9x9滤镜,此长度lo为3。对于两个连续的级别,我们必须将此大小至少增加2个像素(每侧一个像素),以保持大小不均匀,从而确保中央像素的存在。这导致掩模大小总共增加了6个像素(请参见图5)。 Figure 5 我无法理解给定上下文中的界线。 对于两个连续的级别,我们必须将此大小至少增加2个像素(每侧一个像素),以保持大小不均匀,从而确保中央像素的存在。 我知道他们正在尝试对图像的长度进行处理,即使它们试图使图像变得奇怪,以便有一个中心像素,这将使他们能够计算像素梯度的最大值或最小值。我对它的上下文含义有些怀疑。 2。 为了计算描述符,使用了Haar小波。 Σ d X∑ dX\sum\ dx∑ | d x |∑ |dX|\sum\ |dx| 3。 拥有近似滤波器的必要性是什么? 4. 我对他们发现过滤器尺寸的方式没有任何疑问。他们凭经验“做”一些事情。但是,我对这条线有些na 上一节介绍的9x9滤波器的输出被视为初始比例尺层,我们将其称为比例尺s = 1.2(近似σ= 1.2的高斯导数)。 他们是如何发现σ值的。此外,缩放的计算如何完成,如下图所示。我之所以要声明此图像,是因为值s=1.2不断重复出现,而没有清楚说明其起源。 5. 用黑森矩阵表示的L是高斯滤波器和图像的二阶梯度的卷积。 然而,据说“近似”行列式仅包含涉及二阶高斯滤波器的项。 的值为w: 我的问题是为什么行列式如此计算,近似的Hessian和Hessian矩阵之间是什么关系。

2
参数魔鬼—当无法针对groundtruth进行验证时如何设置它们[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 6年前关闭。 题: 我想就无法对groundtruth进行验证的情况下人们如何设置算法参数展开讨论(可能是因为groundtruth无法获得或很难/乏味地获得)。 我已经阅读了许多论文并实现了底层算法,其中---据说一组参数是“凭经验设置的” ---而且我经常发现这些参数会影响算法的通用性(即使该方法所基于的理论是优雅,诱人和稳健的。 如果您能分享您的想法,我将不胜感激。并且,此问题没有正确或错误的答案。我只想知道,其他人如何处理这个问题。 背景/问题来源: 我是一名从事图像分析,计算机视觉和机器学习领域的计算机科学家,每当我设计新算法并且每次发现自己花费了大量时间来调整参数。 另外,我想,我的问题在涉及计算算法的任何领域都更普遍,我想邀请所有相关领域的人们的想法。 我想给您一个具体的例子,以帮助您思考: ---以特征检测为例(比如说圆形斑点或显着点)。您以不同的比例(比例参数)运行某些过滤器(需要参数),并可能将响应设置为阈值(阈值参数)。在这种情况下,通常无法获得验证的依据,从而无法自动调整参数。 ---采用任何涉及大量信号处理组件的计算框架。总是有需要调整的参数,通常没有基础,当您主观调整数据集的随机小子集时,总有一天会遇到无法推广的情况。 当您为算法中的某些中间步骤设置参数时,此参数魔鬼会更麻烦。 而且我经常发现,不可能将为这些参数找到合适的值的问题作为具有目标函数的优化问题,您可以对其求导,从而使用标准的优化算法来找到合适的值。 同样,在许多情况下,将这些参数暴露给最终用户也是不可取的,因为我们经常为非计算最终用户(例如生物学家,医生)开发应用程序/软件,并且当您要求他们进行调整时,它们通常变得毫无头绪。除非它非常直观(例如大约对象大小)。 请分享您的想法。

1
计数图像中的车辆
我一直在尝试实现一种算法,以成功对图像中的汽车进行计数。我尝试在交通图像中存在多车遮挡的情况下实现一种车辆计数方法 它从一组各种图像中估计背景。我已经为此目的研究了各种其他技术,所有这些技术都以一种方式或另一种方式使用了一组图像的背景估计或需要视频。作为输入,我几乎看不到背景(可能是大多数论文中的道路)的交通图像。而且,这些图像来自不同的区域,因此它们也不具有相同的背景。在这种情况下我应该如何进行? 我在想,如果我能以某种方式匹配车辆(汽车)的结构,那么也许它们可以匹配。但是我不知道这是否可行,以及如何进行处理,因为该图像还包含多个被遮挡的车辆。 任何提示,甚至研究论文也欢迎。 样本图像如下:

1
旋转3D图像
我有一个非各向同性体素的3D图像,我正在对其进行一般旋转。如何为旋转后的图像确定合适的体素大小?我需要最大程度地减少信息丢失,但要避免过多的采样以防止图像变得太大。

1
消除边缘的噪音(压缩缺陷)
我有被压缩的卡通图像。这个例子: 它们有这种噪音,很难删除。 即使像素位于灰色背景上,噪声像素也可能具有非常不同的颜色,如果我查看此类图像的(直方图)直方图,我会在主要颜色的色块周围看到很多色块。但是我不能只删除不是主要颜色的有价值的颜色,因为存在删除某些重要特征(例如眼睛)的风险。我也尝试过将图像进行海报化(示例呈现8种颜色),但仍然保留一些像素。 我也尝试过中值滤波器,但是它无法消除如此大的噪音(我使用3 * 3滤波器)。 请提供一些可以在这种情况下有效消除噪音的方法。我将不胜感激!

2
普通英语数字图像时刻
我正在研究OpenCV,在计算机视觉和图像处理中,人们谈论斑点,轮廓,连接区域,有时我会听到“图像时刻”一词。 我知道在Wikipedia上有一篇有关它的文章,但我认为这太技术性了。我真的不想深入了解数学背景,但我想知道我在说什么。 有人可以给我解释一下简单的英语中的图像瞬间吗?

2
轮廓和区域,原始(空间)和中心图像时刻
我最近开始使用图像矩来对二进制图像进行图像处理。我读到,为了轮廓矩是周长和为了面积矩是区域。这些原始时刻都由以下公式给出: 0 吨ħ0Ť ^ h0th0^{th}0Ť ^ h0th0^{th} 中号我Ĵ= ∑X∑ÿX一世ÿĴMij=∑x∑yxiyjM_{ij} = \sum_{x}\sum_{y}x^iy^j。 这意味着,如果我有这样的图像(但是二进制的前景像素以蓝色显示),则时刻将对应于周长,因为它是轮廓的图像:0Ť ^ h0th0^{th} 另一方面,如果我有一个这样的图像(前景显示为while),我将获得对象的区域为时刻:0Ť ^ h0th0^{th} 由于我想使用轮廓获得更多属性,因此我还计算了更高阶(,,阶)原始轮廓矩。我想用这些来获得关键时刻。 2 n d 3 r d1个小号Ť1st1^{st}2ñ d2nd2^{nd}3[R d3rd3^{rd} 我用来获取关键时刻的公式是: μ00= M00μ00=M00\mu_{00} = M_{00} μ01=0μ01=0\mu_{01} = 0 μ10=0μ10=0\mu_{10} = 0 μ11=M11M00−xc∗yc=M11M00−(M10M00)∗(M01M00)μ11=M11M00−xc∗yc=M11M00−(M10M00)∗(M01M00)\mu_{11} = \frac{M_{11}}{M_{00}} - x_c*y_c = \frac{M_{11}}{M_{00}} - (\frac{M_{10}}{M_{00}})*(\frac{M_{01}}{M_{00}}) 计算公式中心矩使用原始的时刻。我的问题是:哪些原始矩用于计算中心矩,面积或轮廓?。我的猜测是面积矩,因为阶中心矩也等于面积,实际上就是阶面积矩。 0 吨ħ0th0th0^{th}0th0th0^{th} 另外,我可以基于轮廓原始弯矩来计算中心弯矩吗?

2
如何在CT扫描DICOM图像中测量肺结节?
在这个问题上,我想重点介绍CT扫描的强度值。首先,请看下面的图片: 上面的图像是原始图像,下面的图像是阈值版本。为了测量任何形状的体积,从理论上讲,仅计算图像中体素的数量是可能的。但是,物体的最外层(例如结节)显示出较暗的强度,而物体内部的所有体素都具有很高的强度。如果仅计算阈值版本中的体素,则极有可能获得大于肺结节实际体积的结果体积。 我还看到有诸如窗口中心(水平)和窗口宽度之类的变量,可用于调整DICOM图像的强度信息。不同的强度可以改变结果量。 所以这是一个问题:如果我要测量任何给定的肺结节,我应该怎么做才能获得最佳的精度?什么时候应该忽略强度较低的体素?还是我必须以其他方式做到这一点?

2
特征检测之前的图像处理
我已经实现了基于Harris角的特征检测器。在大多数情况下,它都能正常工作,但是在某些情况下,它的性能会很差。我需要使其在许多不同的图像上工作而不需要单独配置它。 问题出在检测器阈值上。如果设置得太低,检测器会发射太多次,从而导致大量功能。如果设置得太高,则功能太少。 我已经通过ANMS(自适应非最大抑制)解决了部分问题,以减少特征数量,然后再为它们分配描述符向量。 但是,像这样的图像是一个问题: 它们的对比度低,我不能“负担”所有图像的阈值。这将使检测器在这些图像上起作用,但是其他图像将包含成千上万的特征,而使用ANMS进行过滤将很慢,并且会损害整体性能。 我当时正在考虑在特征检测之前调整图像。直方图均衡也许可以胜任。这可能是有效的操作,因为全局对比度的改变对特征描述符没有影响(它们不变地改变亮度和对比度)。 也许使用自适应阈值或一些启发式方法会更好。 还有其他建议吗?

1
如何扩展和加深图像/视频处理的基本技能?
我没有上图像处理课程,但最近三个月我根据讲义和重要书籍研究了该主题。因此,在这一点上,我想提高我的图像处理能力。当然,我正在练习很多图像处理工作,但工作似乎非常相似。 作为一名程序员,我从顶级编码器或类似的编码器中学到了很多东西,您可以互相竞争以获得更好的编程。我可以在任何网站上争夺图像处理难题吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.