一个简单的答案是,一个由运放构成的,用于校正驱动器响应的平坦频率响应系统在通带中必然具有非常平坦的相位响应。这种非平坦性意味着瞬态声音的分量频率变得不均匀地延迟,导致微妙的瞬态失真,从而妨碍了正确的声音分量识别,这意味着可以分辨出更少的不同声音。
因此,这听起来很糟糕。好像所有声音都来自一个恰好位于人耳之间的模糊球。
上面答案中的HRTF问题只是其中的一部分-另一个问题是,可实现的模拟域电路只能具有因果时间响应,并且要正确地校正驱动器,就需要一个因果滤波器。
可以使用与驱动器匹配的有限冲激响应滤波器进行数字近似,但这需要很小的时间延迟,足以使电影非常不同步。
而且,这听起来仍然像是从您的内心发出的,除非也将HRTF也重新添加进去。
因此,这毕竟不是那么简单。
要创建“透明”系统,您不仅需要在人类听觉范围内平坦的通带,还需要线性相位-平坦的群延迟图-并且有一些证据表明该线性相位需要继续达到令人惊讶的高频率,从而不会丢失方向提示。
通过实验可以很容易地验证这一点:在声音文件编辑器(如Audacity或snd)中打开一些您熟悉的音乐的.wav,然后仅从一个通道中删除一个44100 Hz采样,然后重新对齐另一个通道,以便第一个现在,样本将在已编辑频道的第二个频道中发生,并进行播放。
您会听到一个非常明显的差异,即使该差异只是1/44100秒的时间延迟。
考虑一下:声音大约为340 mm / ms,因此在20 kHz时,这是一个时间误差,加上正负一个采样延迟,即50微秒。这是17毫米的声音传播,但是您可以听到与缺少的22.67微秒的区别,声音传播只有7.7毫米。
一般认为,人耳的绝对截止频率约为20 kHz,这是怎么回事?
答案是听力测试是用测试音进行的,测试音主要一次只包含一个频率,在测试的每个部分都需要相当长的时间。但是我们的内耳由一个物理结构组成,该结构在对声音进行暴露的同时将神经元暴露给声音,从而使位于不同位置的神经元与不同的频率相关。
单个神经元只能如此快速地重新发射,因此在某些情况下,一个接一个地使用几个神经元来跟上它的速度,但这只能在大约4 kHz左右的频率下起作用。音调的感知结束。然而,大脑中没有什么可以阻止神经元在感觉倾斜的任何时候触发,那么最重要的频率是多少?
关键是耳朵之间的微小相位差是可以感知的,但是与其改变我们通过声音的光谱结构识别声音的方式,不如改变我们对声音方向的感知。(HRTF也会改变!)即使它似乎应该“滚开”我们的听觉范围之外。
答案是-3dB或什至-10dB的点仍然太低-您需要达到-80 dB的点才能得到全部。而且,如果您既要处理声音又要保持安静,则需要将声音调低至-100 dB以上。单音收听测试是不可能看到的,主要是因为这样的频率仅在它们与其他谐波同相时作为“尖锐的瞬变声音”的一部分才“计数”-在这种情况下,它们的能量加在一起,达到足够的集中度触发神经反应,即使作为单独的频率成分孤立起来,它们可能太小而无法计数。
另一个问题是,无论如何,我们经常受到许多超声噪声源的轰炸,其中很大一部分可能是由于我们自己内耳的神经元破裂所致,这些噪声在我们生活中的某个先验点受到过分的声级破坏。在如此大的“本地”噪音下,很难分辨出听力测试的隔离输出音调!
因此,这需要“透明”系统设计使用更高的低通频率,以便在系统之前有空间供人类低通淡出(通过您的大脑已经“校准”到其自身的相位调制)。相位调制开始改变瞬态的形状,并及时改变它们的位置,使大脑无法再识别它们属于哪种声音。
使用耳机,要简单地将它们构造为具有足够带宽的单个宽带驱动器,并依靠“未校正”驱动器的非常高的固有频率响应来防止时间失真,要容易得多。这对于耳机来说效果更好,因为驾驶员的体重很小,很适合这种情况。
需要相位线性的原因深深扎根于时域频域对偶性,这也是您无法构建可以“完美校正”任何实际物理系统的零延迟滤波器的原因。
之所以要使用“相位线性”而不是“相位平坦度”,是因为相位曲线的总斜率无关紧要-通过双重性,任何相位斜率都等于恒定的时间延迟。
每个人的外耳都有不同的形状,因此在略有不同的频率下会出现不同的传递函数。您的大脑已经习惯了它拥有的东西,并拥有自己独特的共鸣。如果您使用了错误的耳机,实际上听起来会更糟,因为您的大脑习惯于进行的校正将不再与耳机的传递函数中的校正相对应,并且您会感到比无法消除共振更糟糕的事情-您将有两倍不平衡的极点/零点,使相位延迟杂乱无章,并彻底控制了群延迟和组件到达时间之间的关系。
听起来还不太清楚,您将无法分辨出记录所编码的空间图像。
如果您进行盲人A / B听力测试,那么每个人都将选择未经校正的耳机,至少不会使小组的延迟如此之大,以使他们的大脑可以适应自己的需求。
这就是为什么有源耳机不尝试均衡的原因。很难做到正确。
这也是数字房间校正之所以如此利基的原因:因为正确使用它需要经常进行测量,这些测量很难/不可能进行,并且消费者通常不希望知道。
主要是因为在校正室内的声音共振(大部分是低音响应的一部分)会随着气压,温度和湿度的变化而保持轻微移动,从而使声音速度略有变化,从而使共振远离它们是进行测量的时间。