感谢您的参考!您忘了提到您在鼓增强方面的工作,这对于Summer_More_More_Tea的应用程序可能也很感兴趣。好吧,这真的取决于您要使用它做什么。您是否有特定的“最终应用程序”?
我完全同意pichenettes的上述声明。为了完整起见,我要说的是,MattiRyynänen在卡拉OK音轨生成的一些作品中也使用了您提到的声音增强效果。
要回答您的问题:
考虑到有效性,哪个是首选(或任何其他解决方案:)?
正如皮亨特所说,似乎都不符合您的需求:低通/高通滤波注定会失败,因为人声的谐波结构(通常是任何“有趣”的声音,即正弦波以外的任何声音……) )。
如果是第二个,让两个通道A和B,计算背景时将使用(BA)还是(AB)?与合并两个通道一样,算术方法是否足够准确?
同样,您提到的第二种方法将不会执行,因为您只能删除中间的信号,而无法检索它。换句话说,即使人声在“中心”,也没有简单的数学方法获得人声信号。
或者我可以将每个通道下采样两倍,然后将下采样信号交织为单声道结果?
差...如上所建议,对通道进行平均以获得单通道信号是有意义的,并且不会破坏信号的频谱特性(假设立体声信号未退化)。因此,您获得的单声道信号基本上具有与以前相同的音乐内容。
正确地对每个通道进行降采样意味着您首先要使用一个低通滤波器(在您的情况下,截止频率为ampling_rate / 4),然后可以安全地每2个采样。但是,对于交错采样的通道并没有太多要说的:在大多数情况下,这破坏了信号的频谱特性。您可能不想要那样。
实际上,低通滤波的操作随后是将每2个样本设置为0,并将这些0的引线在傅立叶域中保持为“镜像”保留在高频分量上的低频分量。记住,您会在采样理论上给信号处理课上信号:乘以一系列脉冲(或狄拉克)会导致在傅立叶域中与另一个狄拉克序列卷积,也就是说,在这种情况下,信号的频谱会被重复(周期化)沿频率轴,周期等于采样率。
通常,在下采样时,您会删除0(因为您假设使用新的采样率)。但是在这里,保留它们会导致非常令人讨厌的其他高频成分。交织这些信号并不能解决这个问题。
好吧,总而言之,简短的答案:不要那样做。:-)
最后,我还建议您使用为LVAICA 2012会议开发的GUI:有一个git repo。我仍在调试和改进它,因此欢迎发表评论:D
希望有帮助!