将语音(mp3音频文件)转换为文本


8

我正在寻找从mp3到txt的简单转换器。我尝试过但没有成功:julius,CMU Sphinx,...在过去的4个小时里,我没有找到使用方法(或正确安装它们)的方法。

我正在寻找的是这样的:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

我对GUI应用程序也很好,因为我只有几个文件要转换并且可以单击。

编辑:借助此答案,语音识别应用程序可以将MP3转换为文本?我努力使它工作,但没有任何输出。好吧,实际上它会产生一些空白行(未检测到任何单词)...


您运行的确切命令是什么,看到的输出是什么?
Nikolay Shmyrev

1
$ pocketsphinx_continuous -infile 1.wav -hmm zh-cn / cmusphinx-zh-us-5.2 -lm zh-cn / en-70k-0.2.lm -logfn / dev / null&> otput.txt是确切的命令@NikolayShmyrev问题。我已经从sourceforge.net/projects/cmusphinx/files/…下载了模型。
萨摩

Answers:


4

pocketsphinx将对现有音频文件中的文本进行语音转换。根据mp3的初始格式,您可能需要两个单独的命令。

首先将您现有的音频文件转换为强制输入格式:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

运行口袋狮身人面像

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

创建的文件myspeech.txt将具有您要查找的文件。


如果您是ubuntu的新手,则需要使用以下命令安装上述程序:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg

0

Mozilla SpeechDeep开源语音转文本工具即可。您将需要在Linux桌面上安装该应用程序。或者,您可以尝试Transcribear基于浏览器的语音转文本工具,该工具不需要安装,但是您需要在线连接才能将录音上传到服务器。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.