我的问题是我不知道背景噪声的能量,所以我不能仅仅限制能量。处理是实时完成的,我大约需要500毫秒来决定。理想情况下,我希望将安静的辅音视为非静音。
6
我没有足够的信息来提供完整的答案,但是您的问题被称为语音活动检测。没有一个达成共识的最佳方法,而且如果您看的话,可能会遇到许多不同的方法。也许其他一些可以充实它。
—
詹森·R
@Michael Litvin,有一类非线性滤波器(在“能量检测”中使用,名称为“ Teager-Kaiser”。我认为它是所谓的“ voltera内核”的子集。对不起,我无法提供任何更多信息,但如果您搜索这些单词,您可能会找到所需的信息。我知道,Teager-Kaiser方法用于“何时”鲸鱼的声音相对于背景噪声才开始
—
。– Spacey