哪个转换最能模仿人类的听觉系统?


12

傅里叶变换通常用于声音的频率分析。但是,在分析人类对声音的感知时,它具有一些缺点。例如,其频率仓是线性的,而人耳对数的响应是对数的,而不是线性的

与傅立叶变换不同,小波变换可以修改不同频率范围的分辨率。的小波变换的属性允许大颞载体对于较低频率,同时保持短的时间宽度为更高的频率。

Morlet小波是密切相关的听证会的人类感知。它可以应用于音乐转录并产生非常精确的结果,这是使用傅立叶变换技术无法实现的。它能够捕获每个重复音符和交替音符的短脉冲,每个音符都有清晰的开始和结束时间。

所述恒定-Q变换(密切相关的Morlet小波变换)也非常适合于音乐数据。由于变换的输出实际上是幅度/相位相对于对数频率的信号,因此需要较少的频谱仓即可有效地覆盖给定范围,这在频率跨度为几个八度音阶时证明是有用的。

该变换表现出具有较高频率箱的频率分辨率降低,这对于听觉应用是理想的。它反映了人类的听觉系统,从而在较低频率下频谱分辨率更好,而在较高频率下时间分辨率提高。

我的问题是:还有其他模仿人类听觉系统的转换吗?有没有人试图设计一种在解剖学/神经学上尽可能匹配人类听觉系统的变换?

例如,已知人耳对声音强度具有对数响应。还已知等响度轮廓不仅随强度变化,而且随频谱分量的频率间隔变化。即使总声压保持恒定,在许多关键频带中包含频谱成分的声音也会被感知到更大声。

最后,人耳具有与频率有关的有限时间分辨率。也许也可以考虑到这一点。


您是否对“变换”施加了数学上的限制?
Olli Niemitalo

2
感谢所有链接!
吉尔斯

没有任何单一的变换可以充分模仿像人类听觉系统这样复杂的系统。现有的HAS 模型使用复杂的信号处理架构,并进行多次转换,每个转换都为听力的另一个方面建模。可能是您要考虑逐个建模。
Fat32

Answers:


9

在设计此类转换时,应考虑到相互竞争的利益:

  • 对人类听觉系统的保真度(随人而异),包括非线性甚至混乱的方面(耳鸣)
  • 分析部分数学公式的简便性
  • 离散化或允许快速实施的可能性
  • 存在合适的稳定逆

最近有两个最近的设计引起了我的注意: 听觉驱动的Gammatone小波变换,信号处理,2014年

连续小波变换(CWT)提供良好的时间和频率定位的能力使其成为信号时频分析中的一种流行工具。小波表现出恒定的Q特性,外围听觉系统中的基底膜滤波器也具有这种特性。基底膜过滤器或听觉过滤器通常由Gammatone函数建模,该函数可以很好地近似于实验确定的响应。从这些滤波器派生的滤波器组称为Gammatone滤波器组。通常,小波分析可以比喻为滤波器组分析,因此可以将标准小波分析与Gammatone滤波器组之间的有趣联系联系起来。但是,Gammatone函数不能完全等同于小波,因为它的时间平均值不为零。我们展示了如何利用Gammatone函数构造善意的小波。我们分析属性,例如可接纳性,时间带宽乘积,消失矩,这些属性在小波上下文中特别重要。我们还展示了如何将拟议的听觉小波作为线性,不变位移系统的脉冲响应来产生,该系统由具有恒定系数的线性微分方程控制。我们提出了拟议的CWT的模拟电路实现。我们还展示了如何将源自Gammatone的小波用于瞬态信号的奇异性检测和时频分析。我们还展示了如何将拟议的听觉小波作为线性,不变位移系统的脉冲响应来产生,该系统由具有恒定系数的线性微分方程控制。我们提出了拟议的CWT的模拟电路实现。我们还展示了如何将源自Gammatone的小波用于瞬态信号的奇异性检测和时频分析。我们还展示了如何将拟议的听觉小波作为线性,不变位移系统的脉冲响应来产生,该系统由具有恒定系数的线性微分方程控制。我们提出了拟议的CWT的模拟电路实现。我们还展示了如何将源自Gammatone的小波用于瞬态信号的奇异性检测和时频分析。

ERBlet变换:具有完美重构的基于听觉的时频表示,ICASSP 2013

本文介绍了一种获得声音信号的感知动机和完全可逆的时频表示的方法。基于帧理论和最近的非平稳Gabor变换,提出了一种分辨率随频率变化的线性表示形式,并将其实现为非均匀滤波器组。为了匹配人类听觉的时频分辨率,该变换使用了在心理声学“ ERB”频率尺度上等距间隔的高斯窗口。此外,转换具有适应性强的分辨率和冗余性。仿真显示,即使每个ERB使用一个滤波器且冗余度非常低(1.08),使用快速迭代方法和预处理也可以实现完美的重构。

我还要提到:

基于听觉的音频信号处理转换,WASPAA 2009

本文提出了一种基于听觉的变换。通过分析过程,该转换将时域信号转换为一组滤波器组输出。滤波器组的频率响应和分布与耳蜗基底膜中的相似。信号处理可以在分解后的信号域中进行。通过合成过程,可以通过简单的计算将分解后的信号合成回原始信号。同样,提出了用于离散时间信号的快速算法,用于正向和反向变换。该转换已在理论上得到批准并在实验中得到验证。给出了一个降噪应用的例子。所提出的变换对背景噪声和计算噪声具有鲁棒性,并且没有音调谐波。


1
这正是我想要的。谢谢。
user76284 '17
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.