信号处理

为信号,图像和视频处理领域的艺术和科学从业者提供的问答


3
校正窗口增益是否习惯?
考虑如何定义Hanning窗口: 0.5 - 0.5 * cos(n*2*Pi/(N-1)) 根据此定义,它具有0.5的增益,这仅仅是系数的平均值。相比之下,据定义,平顶窗具有单位增益,大概是设计使然。 将Hanning窗口缩放2倍似乎是合适的,但我从未在任何地方讨论过此问题。似乎所有窗口都应缩放以获得单位增益。 在实践中,通常会针对窗口进行增益校正吗?如果没有,为什么不呢? 编辑: 由于没有人给出答案,所以我会详细说明。 很容易找到报告更常见窗口的论文。但是我从未见过有人在将增益用于频谱分析之前提到校正增益。也许我一直都错过了这个表述,或者每个人都认为增益校正是显而易见的要求。 将窗口的增益设置为1以保持信号的能级似乎是常识。此外,如果一个像平板一样具有0 dB的增益,而另一个像高斯一样具有近10 dB的损耗,那么一个如何比较各种窗口的幅度精度。 Windows也被广泛用于FIR滤波器设计。在此应用中,应该清楚的是,要加窗的信号(正弦脉冲)的大部分能量都位于窗的中心。因此,窗口几乎无法减少正弦脉冲的总能量。因此,当用于滤波器设计时,我们不希望单位增益,而是想要像平顶窗以外的大多数窗口一样的单位峰值幅度。除单位峰值幅度外的其他因素都会影响所得FIR滤波器的增益。


1
超声波信号检测
我创建了一个相当简单的TDOA系统,该系统使用从两个扬声器发出的超声波信号来定位(相对于扬声器)移动电话。这两个信号按频率分开。 该系统具有以下约束: 信号必须听不到。为此,我们坚持使用高于17 kHz的频率。少数人仍然可以听到,但大多数人听不到。 采样率为44.1 kHz。 音乐通常会在播放,因此在较低频率下会有很多干扰。 我们无法控制扬声器和麦克风在较高频率下的运行状况,因此我们将上限保持在20 kHz左右。 我使用的特定信号是BPSK调制的13位Barker码,因为它们具有良好的自相关特性。自相关如下所示: 但是,当我将期望信号与现实生活中的接收信号互相关时,我通常会得到如下所示: 蓝色是与扬声器1信号的互相关,红色是与扬声器2信号的互相关。由于麦克风的定向增益,回波似乎很明显,并且不幸的是,通常比直接路径信号要强。 我尝试仅检测信号的最早出现,因为这很可能是直接路径。这种方法对我用来确定何时存在信号的阈值非常敏感,因此根本不够鲁棒。 我想要一种确定信号的“真实”到达时间(即直接路径信号的到达时间)的可靠方法。也许某种形式的信道估计和反卷积?如果是这样,那将如何工作? 数据/代码:我想明确地说,我不希望任何人分析数据或检查我的代码。我已经提供了它们,以备您需要。我主要对想法感兴趣。 我提供了原始接收信号和调制后的预期信号供下载。它们均以44.1 kHz采样。将接收到的信号与预期信号相关联会产生与上图类似但不同的东西,因为在将接收到的信号与预期信号相关之前,我将接收到的信号移至基带并进行了抽取。 接收信号 预期信号1 预期信号2 Matlab脚本 Matlab脚本同时具有信号生成脚本(genLocationSig.m)和我的接收/处理脚本(calcTimingOffset.m)。

4
是否可以存在没有相移的因果滤波器?
当我研究半导体和电介质中折射率的色散时,我的教授试图解释说,如果一个滤波器(例如吸收某些光频率的电介质或电RC滤波器)消除了某些频率,那么其余的必须进行相移补偿从整个信号中减去的那些频率(像通常的单色信号一样在时间上无限扩展),以保持因果关系。 我直觉上理解他在说什么,但我不确定他的论点是否真的合理-即是否可以存在一个非平凡的滤波器,该滤波器吸收某些频率并使其余频率保持不变,但仍保留因果关系。我似乎无法构建一个,但无法证明它也不存在。 因此,问题是:如何证明因果滤波器必须使频率的相位彼此相对偏移?
9 filters  phase 

3
这是对MFCC计算中DCT步骤的正确解释吗?
这是这里讨论的延续。我会在那发表评论,但我没有50名代表,所以我想提出一个新问题。 这就是我对MFCC计算过程中DCT步骤的理解:其背后的原理是,由于滤波器的重叠,将对数谱幅值的相关性(与滤波器组分开)。从本质上讲,DCT平滑了由这些对数频谱幅度给出的频谱表示。 正确地说,下图中的蓝线代表对数谱幅值矢量所代表的光谱,而红线是经过DCT校正后的矢量吗?
9 mfcc  dct 

2
谁能解释这个MDFT多相滤波器组?
我发现一个很有趣的一块为MDFT代码多相滤波器组在这里。不幸的是,似乎没有一篇描述该理论的论文。有人知道该代码的参考吗?我对以下3个主题特别感兴趣: 通道中到底有哪些数据?它们应该是真实的,虚构的还是复杂的? 该代码仅计算频带数量的一半。那是由于使用了实值信号吗? 合成阶段的结果建立为两个合成滤波器组结果的通道差异。为什么这样做呢?我找不到任何描述此想法的论文。

1
从太空探测器图像中删除伪像
这是我们的家庭世界的照片,最近由朱诺(Juno)太空船拍摄,在飞向木星的途中被弹射。速度的提高,我们迷失了,但值得庆幸的是,我们不会掉入阳光下。 我认为南美大陆在左边。 但是,我们可以注意到图像上存在某种伪像,图像上存在一种模糊的蓝色条。我对可能是什么原因感到好奇。 我真正想知道的是,为数不多的人类可能会使用什么图像处理技术来消除这种伪影?

3
fft相谱令人困惑!
一个非常简单的MATLAB实验: f = 200; fs = 1000; t = 0: 1/fs : 1; x = cos(2*pi*f*t); plot(angle(fftshift(fft(x)))); 这是输出: 现在,对上面的代码片段进行较小的更改;将持续时间减少1个样本,如下所示: f = 200; fs = 1000; t = 0: 1/fs : 1 - 1/fs; x = cos(2*pi*f*t); plot(angle(fftshift(fft(x)))); 而且相位频谱变得非常疯狂: 问题: 在第一个图中,我希望看到仓700处的零相位,在此示例中,该相位对应于200的正频率。事实并非如此。其次,我不理解图1中图形的线性部分。我确实理解由于所谓的数字噪声而可能存在的相位分量,但是该噪声如何在相位上如此“线性”呢? 在第二个图中,为什么只删除一个样本会对相图产生如此大的影响? 我在这里做错什么吗?
9 fft  matlab  phase 

2
了解SURF特征计算过程
因此,我正在阅读有关SURF的论文(Bay,Ess,Tuytelaars,Van Gool:加速鲁棒功能(SURF)),而我无法理解以下段落: 由于使用了框式滤镜和积分图像,因此我们不必将相同的滤镜迭代地应用于先前已滤过图层的输出,而是可以将完全相同速度的任何大小的框式滤镜直接应用于原始图像,并且即使是并行的(尽管此处未利用后者)。因此,通过扩大滤波器的大小而不是迭代地减小图像的大小来分析缩放空间,如图4所示。 This is figure 4 in question. PS:本文对整体图像进行了解释,但是本文的全部内容基于上面的特定段落。如果有人阅读了本文,您能否简要介绍一下这里发生的事情。整个数学解释都很复杂,需要首先掌握,因此我需要一些帮助。谢谢。 编辑,几个问题: 1。 每个八度细分为恒定数量的音阶。由于积分图像的离散性,两个后续比例之间的最小比例差异取决于部分二阶导数在导数方向(x或y)上正负叶的长度lo,将其设置为过滤器尺寸长度的三分之一。对于9x9滤镜,此长度lo为3。对于两个连续的级别,我们必须将此大小至少增加2个像素(每侧一个像素),以保持大小不均匀,从而确保中央像素的存在。这导致掩模大小总共增加了6个像素(请参见图5)。 Figure 5 我无法理解给定上下文中的界线。 对于两个连续的级别,我们必须将此大小至少增加2个像素(每侧一个像素),以保持大小不均匀,从而确保中央像素的存在。 我知道他们正在尝试对图像的长度进行处理,即使它们试图使图像变得奇怪,以便有一个中心像素,这将使他们能够计算像素梯度的最大值或最小值。我对它的上下文含义有些怀疑。 2。 为了计算描述符,使用了Haar小波。 Σ d X∑ dX\sum\ dx∑ | d x |∑ |dX|\sum\ |dx| 3。 拥有近似滤波器的必要性是什么? 4. 我对他们发现过滤器尺寸的方式没有任何疑问。他们凭经验“做”一些事情。但是,我对这条线有些na 上一节介绍的9x9滤波器的输出被视为初始比例尺层,我们将其称为比例尺s = 1.2(近似σ= 1.2的高斯导数)。 他们是如何发现σ值的。此外,缩放的计算如何完成,如下图所示。我之所以要声明此图像,是因为值s=1.2不断重复出现,而没有清楚说明其起源。 5. 用黑森矩阵表示的L是高斯滤波器和图像的二阶梯度的卷积。 然而,据说“近似”行列式仅包含涉及二阶高斯滤波器的项。 的值为w: 我的问题是为什么行列式如此计算,近似的Hessian和Hessian矩阵之间是什么关系。

2
MATLAB中的光谱熵计算
如何在MATLAB中计算信号的谱熵?我知道基本的步骤,但是如果有人可以提供帮助,那就太好了, 使用MATLAB中的FFT命令计算信号的功率谱。 使用功率谱或任何其他技术计算功率谱密度。 正常化之间的功率谱密度,使得它可以作为一个概率密度函数来处理p 我。[ 0 ,1 ][0,1个][0, 1]p一世p一世p_i 计算熵H(s )= − ∑ p一世日志2(p一世)H(s)=-∑p一世日志2⁡(p一世)H(s) = -\sum p_i\log_2\left(p_i\right)

3
什么是光谱增白?
DSP中的“光谱增白”是什么意思? 在图像处理中使用光谱增白会有什么影响?(视觉或其他方式...) 在音频处理或分析中,频谱白化在哪里有用?频谱变白的音频信号听起来像什么?

1
关于SIFT描述符的故事背后是什么故事?
以下摘自Lowe 2004论文(http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf)。 一种明显的方法是在适当的比例下对关键点周围的局部图像强度进行采样,并使用归一化的相关度量进行匹配。但是,图像斑块的简单关联对引起样本重合失调的变化非常敏感,例如细微或3D视点变化或非刚性变形。Edelman,Intrator和Poggio(1997)证明了一种更好的方法。他们提出的表示是基于生物视觉的模型,特别是初级视觉皮层中复杂神经元的模型。这些复杂的神经元对特定方向和空间频率的梯度有反应,但是梯度在视网膜上的位置被允许在较小的感受野上移动而不是精确定位。Edelman等。假设这些复杂神经元的功能是允许从多种角度匹配和识别3D对象。 我试图了解SIFT描述符。我了解上一阶段(关键点检测器)。 我不知道为什么要这样实施。我想知道故事背后的故事。
9 sift 

2
参数魔鬼—当无法针对groundtruth进行验证时如何设置它们[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 6年前关闭。 题: 我想就无法对groundtruth进行验证的情况下人们如何设置算法参数展开讨论(可能是因为groundtruth无法获得或很难/乏味地获得)。 我已经阅读了许多论文并实现了底层算法,其中---据说一组参数是“凭经验设置的” ---而且我经常发现这些参数会影响算法的通用性(即使该方法所基于的理论是优雅,诱人和稳健的。 如果您能分享您的想法,我将不胜感激。并且,此问题没有正确或错误的答案。我只想知道,其他人如何处理这个问题。 背景/问题来源: 我是一名从事图像分析,计算机视觉和机器学习领域的计算机科学家,每当我设计新算法并且每次发现自己花费了大量时间来调整参数。 另外,我想,我的问题在涉及计算算法的任何领域都更普遍,我想邀请所有相关领域的人们的想法。 我想给您一个具体的例子,以帮助您思考: ---以特征检测为例(比如说圆形斑点或显着点)。您以不同的比例(比例参数)运行某些过滤器(需要参数),并可能将响应设置为阈值(阈值参数)。在这种情况下,通常无法获得验证的依据,从而无法自动调整参数。 ---采用任何涉及大量信号处理组件的计算框架。总是有需要调整的参数,通常没有基础,当您主观调整数据集的随机小子集时,总有一天会遇到无法推广的情况。 当您为算法中的某些中间步骤设置参数时,此参数魔鬼会更麻烦。 而且我经常发现,不可能将为这些参数找到合适的值的问题作为具有目标函数的优化问题,您可以对其求导,从而使用标准的优化算法来找到合适的值。 同样,在许多情况下,将这些参数暴露给最终用户也是不可取的,因为我们经常为非计算最终用户(例如生物学家,医生)开发应用程序/软件,并且当您要求他们进行调整时,它们通常变得毫无头绪。除非它非常直观(例如大约对象大小)。 请分享您的想法。

1
非对称伯努利矩阵是否满足RIP?
限定感测矩阵通过的概率为,和的概率为。是否满足受限的等距特性?n×Nn×Nn\times NAAAAij=0Aij=0A_{ij} = 0pppAij=1/n−−√Aij=1/nA_{ij} = 1/\sqrt{n}1−p1−p1-pAAA 作为参考,以下论文回答了对称情况: RG Baraniuk,MA Davenport,RA DeVore和MB Wakin,“随机矩阵的受限等距特性的简单证明”,构造近似,28(3),第253-263页,2008年12月。(pdf)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.