Questions tagged «speech»

4
用于语音活动检测的库(非语音识别)
在回答我之前的问题时,我想知道是否存在任何语音检测库。通过语音检测,我的意思是传递音频缓冲区并获取语音开始和停止位置的索引。因此,如果我在44kHz的频率下有10秒的音频采样时间,那么我希望得到一个数字数组,例如: 44000 88000 123000 190334 ... 例如,这将表明语音从一秒钟开始,然后在两秒钟之内结束,依此类推。 我不需要的是语音识别,它可以从口语单词中写出文字。不幸的是,这是我在Google“语音检测”中看到的很多内容。 如果该库是C,C ++甚至是Objective-C,那将非常好,因为我正在为iPhone编写应用程序。 谢谢!
18 audio  speech 

2
什么时候应该计算PSD而不是普通FFT幅度谱?
我有一个30秒的语音信号,它以44.1 kHz的频率采样。现在,我想展示一下语音的频率。但是,我不确定这样做的最佳方法是什么。似乎有时会计算傅立叶变换的绝对值,有时会计算功率谱密度。如果我理解正确,后者的工作原理就是将信号分成几部分,逐份进行FFT,然后以某种方式将它们相加。窗口函数以某种方式涉及。您能为我澄清一下吗?我是DSP的新手。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.