我从视频文件中提取音频片段以进行语音识别。这些视频来自移动/其他手工设备,因此包含很多噪音。我想减少音频的背景噪音,以便清晰传达给语音识别引擎的语音。我正在使用ffmpeg来完成所有这些工作,但仍停留在降噪阶段。
到目前为止,我已经尝试过以下过滤器:
ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav
ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav
ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav
但是结果非常令人失望。我的理由是,由于语音低于300-3000 Hz的范围,我可以过滤掉所有其他频率以抑制任何背景噪声。我想念什么?
另外,我了解了可用于语音增强的weiner过滤器,发现了这一点,但不确定如何使用。