的傅里叶变换通常用于声音的频率分析。但是,在分析人类对声音的感知时,它具有一些缺点。例如,其频率仓是线性的,而人耳对数的响应是对数的,而不是线性的。
与傅立叶变换不同,小波变换可以修改不同频率范围的分辨率。的小波变换的属性允许大颞载体对于较低频率,同时保持短的时间宽度为更高的频率。
该Morlet小波是密切相关的听证会的人类感知。它可以应用于音乐转录并产生非常精确的结果,这是使用傅立叶变换技术无法实现的。它能够捕获每个重复音符和交替音符的短脉冲,每个音符都有清晰的开始和结束时间。
所述恒定-Q变换(密切相关的Morlet小波变换)也非常适合于音乐数据。由于变换的输出实际上是幅度/相位相对于对数频率的信号,因此需要较少的频谱仓即可有效地覆盖给定范围,这在频率跨度为几个八度音阶时证明是有用的。
该变换表现出具有较高频率箱的频率分辨率降低,这对于听觉应用是理想的。它反映了人类的听觉系统,从而在较低频率下频谱分辨率更好,而在较高频率下时间分辨率提高。
我的问题是:还有其他模仿人类听觉系统的转换吗?有没有人试图设计一种在解剖学/神经学上尽可能匹配人类听觉系统的变换?
例如,已知人耳对声音强度具有对数响应。还已知等响度轮廓不仅随强度变化,而且随频谱分量的频率间隔变化。即使总声压保持恒定,在许多关键频带中包含频谱成分的声音也会被感知到更大声。
最后,人耳具有与频率有关的有限时间分辨率。也许也可以考虑到这一点。