Questions tagged «frequency-spectrum»

时域信号的频谱是该信号在频域中的表示。

1
哪个转换最能模仿人类的听觉系统?
的傅里叶变换通常用于声音的频率分析。但是,在分析人类对声音的感知时,它具有一些缺点。例如,其频率仓是线性的,而人耳对数的响应是对数的,而不是线性的。 与傅立叶变换不同,小波变换可以修改不同频率范围的分辨率。的小波变换的属性允许大颞载体对于较低频率,同时保持短的时间宽度为更高的频率。 该Morlet小波是密切相关的听证会的人类感知。它可以应用于音乐转录并产生非常精确的结果,这是使用傅立叶变换技术无法实现的。它能够捕获每个重复音符和交替音符的短脉冲,每个音符都有清晰的开始和结束时间。 所述恒定-Q变换(密切相关的Morlet小波变换)也非常适合于音乐数据。由于变换的输出实际上是幅度/相位相对于对数频率的信号,因此需要较少的频谱仓即可有效地覆盖给定范围,这在频率跨度为几个八度音阶时证明是有用的。 该变换表现出具有较高频率箱的频率分辨率降低,这对于听觉应用是理想的。它反映了人类的听觉系统,从而在较低频率下频谱分辨率更好,而在较高频率下时间分辨率提高。 我的问题是:还有其他模仿人类听觉系统的转换吗?有没有人试图设计一种在解剖学/神经学上尽可能匹配人类听觉系统的变换? 例如,已知人耳对声音强度具有对数响应。还已知等响度轮廓不仅随强度变化,而且随频谱分量的频率间隔变化。即使总声压保持恒定,在许多关键频带中包含频谱成分的声音也会被感知到更大声。 最后,人耳具有与频率有关的有限时间分辨率。也许也可以考虑到这一点。

2
什么时候应该计算PSD而不是普通FFT幅度谱?
我有一个30秒的语音信号,它以44.1 kHz的频率采样。现在,我想展示一下语音的频率。但是,我不确定这样做的最佳方法是什么。似乎有时会计算傅立叶变换的绝对值,有时会计算功率谱密度。如果我理解正确,后者的工作原理就是将信号分成几部分,逐份进行FFT,然后以某种方式将它们相加。窗口函数以某种方式涉及。您能为我澄清一下吗?我是DSP的新手。


1
识别歌曲中的数学函数
我是DSP的新手,刚刚发现了这个StackExchange,因此,如果不是发布此问题的正确位置,请道歉。 是否有资源以更数学的术语描述类型?例如,如果我已经对歌曲这一部分的信号执行了FFT(如果链接没有从那里开始,则是2:09),那么我有什么办法可以检测到该部分的分类很粗糙的声音?这样的声音是否遵循我可以比较的一些数学函数? http://www.youtube.com/watch?v=SFu2DfPDGeU&feature=player_detailpage#t=130s(链接立即开始播放声音) 是使用监督学习技术的唯一方法,还是有其他方法(最好不需要监督)? 感谢您的任何建议。

3
如果频率分辨率良好,为什么在零填充后DFT中会有频率泄漏?
让我们考虑这个例子: Fs=1000; Ns=500; t=0:1/Fs:(Ns-1)*1/Fs; f1=10; f2=400; x=5+5*sin(2*pi*f1*t)+2*sin(2*pi*f2*t); X=fft(x); 在这种情况下,频率分辨率为2,并且正确捕获了所有频率分量。但是,如果我这样做: X=fft(x,1000); 频率分辨率为1,但存在频谱泄漏。在这里看到类似的效果。在我看来,两个窗口的傅立叶变换(一个长度为500,一个长度为1000)在信号中显示的频率处为零,所以我不明白为什么会发生泄漏?

3
(实际)正弦波音调和脉冲的带宽是多少?
我想知道如何计算带宽: 恒定(真实)的正弦音调 一个(真实的)正弦脉冲。 问题就这么简单,但是我很难确定恒定音调的带宽应该从什么开始,从那里开始脉冲的带宽应该是多少。 在频域中,存在一个恒定的真实频率频率,它是两个增量函数,分别位于和,但是如何计算其带宽呢?ffffff−f−f-f 此外,关于脉冲,这是时间上的矩形函数,因此在频域中是正弦,所以它的带宽不就是,其中是脉冲的持续时间吗?1T1T\frac{1}{T}TTT

4
DFT-通过卷积消除光谱域中的窗效应
我当时在考虑DFT窗口化主题,然后想到一个想法。DFT将产生与所用窗口频谱卷积的信号频谱,因此具有主瓣和旁瓣。 我认为可以通过再次对信号和窗口频谱幅度进行卷积来消除对信号频谱的窗口效应,而且确实如您在下图中看到的那样工作。 左边是用汉宁窗生成的原始光谱。右侧是由汉宁窗的DFT卷积的光谱。顶部是Spectrum本身,底部是MATLAB findpeaks结果。 我从未读过任何有关该技术的文章,但是我很确定自己还没有发明任何东西。因此,我想知道从频谱上进行此处理是否有好处,或者我看不到它的不利之处。 据我所知,这可以帮助进行峰值检测,就像我们在上一张图片中看到的那样。同样,正如我们在下面的两幅图像中所看到的,频谱似乎有些失真。: 蓝色图是光谱,红色图是后卷积光谱。 有什么想法吗? FFT后的卷积是否会引起问题? 有论文可以治疗这个问题吗? 编辑 您可以在此处找到一个脚本,该脚本将生成以下图形:

1
设计特征向量以区分不同的声音波形
考虑以下四个波形信号: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 171.8134 178.3905 180.8994 172.1375 149.2719 …

2
关于时频图像的去噪
我想知道什么样的技术可以用来“ 消噪 ”以下使用Welch方法创建的示例时频图像。下图是从机器人传感器创建的。(这不是彩色图像-它是灰度图像-添加的颜色仅用于视觉目的)。 目标: 我的目标是最终估计存在这种脉冲时在此处看到的脉冲间隔。这可能有点像鸡和鸡蛋,所以为此,我问自己:“是否存在这种重复率+/- 10%的脉冲?”,然后继续进行检测。您在这里看到的是信号(脉冲),但还有其他不需要的干扰。然而,正如埃姆雷(Emre)所建议的那样,它们具有结构,尽管在时空空间中也是如此。是否存在这样的时频滤波器? 我非常希望看到此处应用了图像处理解决方案,但欢迎任何解决方案。 因此:目的是去除可见的所有高强度信号,除了重复脉冲(在y轴的索引300附近)。所有其他高强度信号都可以视为“干扰”。 您可能做出的假设: 您可能假设您大致知道在这里看到的脉冲长度。(让我们说,在+/- 10%以内)。换句话说,您已决定寻找这种长度的脉冲。(+/-) 您可能假设您也大致了解了脉冲的重复率(再次,让我们说+/- 10%)。 不幸的是,您不知道它们的频率。也就是说,在此图像中,脉冲为300,但是它们很容易达到100、50、489。但是,好消息是,此处显示的那些频率彼此非常接近,大约为10赫兹。 我的一些想法: 图像处理POV: 我进行了形态学操作,但是我对那些操作员不太熟悉,不知道它们是否可行。我想这个想法可能是“关闭”并因此去除“更大”的污渍? 行扫描DFT操作可能会根据感兴趣的行具有最高的重复模式来指示要清空的行,但是,如果脉冲很少且相距较远,或者如果图像噪声较大,则可能不是可行的解决方案。 仅通过查看图像,您几乎就想“奖励”隔离和“惩罚”连通性。是否存在可以完成此类操作的图像处理方法?(再次是形态上的)。 哪些方法可以帮助您? 信号处理POV: 此处显示的频率范围已经非常狭窄,因此我不确定陷波滤波操作是否会有所帮助。此外,在这个狭窄范围内显示的脉冲的确切频率是先验的。 通过对此处感兴趣的脉冲进行有根据的猜测,(它们的长度和重复时间)也许可以计算出我的“模板” 的二维DFT,并将其用作二维倒谱时间滤波器,我只需将上面显示的Welch图像乘以,然后执行反二维DFT? OTOH也许Gabor过滤器在这里会是一个很好的选择吗?毕竟,它们是方向敏感的过滤器,类似于我们自己的内置V1视觉处理器。在这里如何利用它们? 哪些方法可以在此领域提供帮助? 提前致谢。

3
色度二次采样:如何正确计算数据速率
我很难理解在利用Y'UV图像中的色度二次采样时如何计算数据速率: 我有以下示例进行计算: 图像分辨率:352*288 频率:25 fps 对于(4:4:4),示例计算如下: (352px * 288px) * 3 color channels * 25 fps * 8 bit = 60 825 600 bit/s 到目前为止,一切都很好。 但是现在来了(4:2:0): (352px*288px) * 1.5 color channels * 25 * 8 = 30 412 800 bit/s 现在,尝试将此示例转换为例如(4:1:1),我意识到我不确定自己是否正确理解如何计算1.5个颜色通道的比率。 我对计算的第一个猜测是在(4:2:0)的情况下: 2/4*3=1.5 color channels 同样,对于(4:1:1),我将计算颜色通道的比率为: 1/4*3=0.75 color channels 但是我根本不确定这是否是正确的方法。 …

1
创建频谱图
我一直在尝试确定此任务的逻辑,并计划使用KissFFT源程序包执行快速傅立叶变换。请让我知道这是否正确: 分配FFT结构,即。我正在使用的窗口大小kiss_fft_alloc(N,0,NULL,NULL) 在哪里N。输入缓冲区将是N类型为的元素数组kiss_fft_scalar。输出缓冲区将是N/2 + 1类型为的元素数组kiss_fft_cpx。 解码N(窗口大小)PCM样本数。 对于每个PCM样本,平均每个通道的振幅(无符号样本),并从0缩放到2(除以65536.0),然后将结果存储到输入缓冲区中。 在输入缓冲区上执行窗口化(即Hanning)。 对输入缓冲区执行快速傅立叶变换,并将其存储到输出缓冲区中。由于我使用实数值作为输入,因此可以使用kiss_fftr()。 对于N/2输出值,获取转换后数据的平方大小,然后使用以下公式将这些值转换为dB刻度: 10 * log10 (re * re + im * im) 绘制N/2步骤6中的值。 丢弃输入缓冲区的前半部分,解码下一个(窗口大小/ 2)PCM样本,并对数据执行缩放和加窗操作。这样可以有效地滑动输入窗口,并避免必须在已处理的PCM样本上重做数学运算。 循环至步骤5,重复这些步骤,直到处理完所有样本为止。 从中释放已使用的内存kiss_fft_alloc()。 建议在执行FFT之前先从输入窗口中减去一个值,以使所得的DC值的大小为零。我应该从输入数据中减去平均值还是平均值? 另外,选择窗口大小时需要考虑哪些事项?除此之外,按照KissFFT的说明,它必须是偶数,使用较小的窗口大小也有好处。它会提供更好的图形吗?我认为大窗口大小会减少必须执行的FFT数量,这是使用大窗口大小的唯一好处吗? XXx 预先感谢您提供的所有指导。

2
音高检测中的谐波产品频谱限制
我已经使用HPS制作了音高检测算法,但遇到了问题。我是信号处理的初学者,这个站点以前曾帮助过我,所以我应该问一下。 对于更高的音调( eg. >C6:1046.50hz),我开始从HPS获取垃圾数据。音调越高,我得到的垃圾越多(“垃圾”是指既不是倍频程误差也不是谐波的频率,大约在1Hz-20Hz) 我的经验观察到: 如果基音高于A6左右,则结果对于更高的音调是最差的,我只会得到垃圾数据。 即使在非常高的音调下,FFT也能正常工作(按我的意思是,它的峰值显示的是基波或谐波之一,但没有垃圾) 如果我降低了考虑使用HPS的谐波数量,垃圾将减少,但是这使得区分基波和谐波变得更加困难。 这是我的算法: ->raw buffer -> hann window, 16384 samples, 50% overlap -> zero padding -> FFT -> HPS 任何帮助表示赞赏! 更新1:因此,我还要添加一些其他内容: 我记录的采样率为44100 Hz 我观察到这种行为在吉他上几乎看不到,但在数码钢琴上却很明显(对于相同的演奏音符) 这是我的hps算法,也许经验丰富的人可以发现问题。 int hps(float* spectrum, int spectrumSize, int harmonics) { int i, j, maxSearchIndex, maxBin; maxSearchIndex = spectrumSize/harmonics; maxBin = 1; …

2
您如何处理复杂信号功率谱中的负频率?
当我们应用上的实信号的DFT运算获得,然后取的平方量值,,功率谱是对称的。您可以将正频率或负频率作为的频率信息。X [ k ] X [ k ] | X [ k ] | 2 X [ k ]x [ n ]X[ñ]x[n]X[ k ]X[ķ]X[k]X[ k ]X[ķ]X[k]| X[ k ] |2|X[ķ]|2\lvert X[k]\rvert^2X[ k ]X[ķ]X[k] 但是,对于复数值信号而言并非如此。功率谱不对称。 在这种情况下,您将如何确定原始信号中的频率分量? 我们可以不去掉负频率部分吗?

3
什么是“频谱时刻”?
我已经咨询了Google和Wiki的全能预言家,但似乎找不到“频谱的时刻”一词的定义。 我正在阅读的旧版工作文本以以下方式使用它,将每单位时间的过零次数定义如下: N0=1π(m2m0)1/2ñ0=1个π(米2米0)1个/2 N_0 = \frac1{\pi} \left(\frac{m_2}{m_0}\right)^{1/2} 然后,它进一步定义了单位时间的极值数目,如下所示: Ne=1π(m4m2)1/2ñË=1个π(米4米2)1个/2 N_e = \frac{1}{\pi}\left(\frac{m_4}{m_2}\right)^{1/2} 最后说出“是频谱的第个矩”。mi米一世m_ii一世i 有人遇到过吗?频谱的“时刻”是什么?我以前从未在DSP文献中听说过它。

3
什么是光谱增白?
DSP中的“光谱增白”是什么意思? 在图像处理中使用光谱增白会有什么影响?(视觉或其他方式...) 在音频处理或分析中,频谱白化在哪里有用?频谱变白的音频信号听起来像什么?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.