音频信号插值的最新技术


11

三个问题:

  1. 一个可以客观地测量音频插值质量的指标是什么?(如果可能,还包括心理声学方面的内容)

  2. 通过这些指标,音频插值技术的最新状态是什么?

  3. 假设我要以两种分辨率从虚拟仪器的音符序列中渲染两个文件,然后将一个文件的上采样与高频渲染版本进行比较,那么可以使用哪种软件客观地比较这些文件?-理想情况下使用上述指标

到目前为止,据我所知,这些重采样器提供了一些最好的质量

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

这些重采样器似乎存在的问题之一是振铃前后。

我应该指出,最重要的是信号重构(因为该术语意义重大),因此上采样比下采样更多。

编辑:在这种情况下插值时间效率是不相关的。

最好的问候,好奇:-)

Answers:


5

关于您在重采样器中注意到的“问题”:

许多重采样算法都使用线性相位低通滤波器多相位插值内核。与线性相位插值内核(具有相同的频率响应)相比,最小相位滤波器插值内核会在重采样到较高采样率时产生较少的预振铃,这可能客观上测量为精度较差,但可能会产生心理干扰。听觉上对人类“更好”。

这是有关创建最小相位滤波器以减少潜在的预振铃的注意事项:http : //www.music.columbia.edu/pipermail/music-dsp/2004-February/059372.html

同样,由Remez(Parks-McClellan)设计的低通滤波器在频域中可能具有明显的周期性波动,这也可能在时域中产生预振铃脉冲。因此,对于重采样插值内核,您可能希望尝试使用窗口Sinc或经典模拟滤波器的衍生产品,以进行低通滤波器设计(后者通常会导致相位更接近最小相位)。


关于最小相位滤波器的观点:我不确定前两个链接,但是iZotope的SRC允许在最小和线性之间连续变化的相位。在听力测试中,人们确实会喜欢最小相位和线性相位之间的某个地方。
schnarf 2012年

就时域振铃而言,开窗Sinc滤波器不一定比等式(通过Remez交换设计)滤波器更好。振铃效应称为吉布斯现象,当您限制包含不连续信号(例如方波)的信号时会观察到。它不是由等波纹滤波器的频域纹波引起的。当您使用截止频率非常高的滤镜时,效果会更明显。增加过渡宽度可以有所缓解。
杰森R

@Jason R:时域中的正弦波=频域中的脉冲,其位置取决于正弦波的脉动速率。现在反转两个域,并在频域响应中放置一个类似正弦的波纹。脉冲进入时域,其位置取决于纹波特性。
hotpaw2,2012年

@ hotpaw2:我看到你的比喻。我误解了您所说的“振铃前冲动”的意图。
杰森R

同样,时域中的平滑窗口通过卷积在频域中的不连续点周围再现其非间断形状,从而减少了吉布斯过冲。
hotpaw2'1

6

重采样算法有一个非常全面的比较:http : //src.infinitewave.ca/

您可以在那里看到他们使用的测试。混叠是一个很大的问题,使用正弦扫描的频谱图很容易将其可视化。还有高频响应-SRC除了可以使高频产生混叠外,还可以降低高频。您可以使用脉冲响应图或相位响应图来可视化相位响应。


是的,我知道这个很好的资源。我只是想知道在测量重采样(尤其是上采样)性能时所有值得测量的参数。
Bent Rasmussen 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.