Answers:
一个非常简约的TTS,听起来比espeak或mbrola更好。一些信息在这里。
我不明白为什么pico2wave与espeak或mbrola相比很少讨论。它很小,但听起来确实不错(自然)。未经修改,您将听到自然的女性声音。
AND ...与Mbrola相比,它可以识别单位并以正确的方式说话!
例如:
安装后,我在脚本中使用它:
#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
然后使用所需的文本运行它:
<scriptname>.sh "hello world"
或读取整个文件的内容:
<scriptname>.sh "$(cat <filename>)"
在Ubuntu上拥有轻巧,稳定的TTS就是所有这些。
pico2wave
libttspico-utils
在最新版本的ubuntu 中已打包。@CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=)。同意此CLI界面设计不当:与绝大多数的CLI不同,它可能达到OS的最大CLI参数长度。
echo {1..1000}
我相信Ive使用名为“ SpeakIt”的Google Chrome扩展程序免费找到了最好的TTS软件。这仅对我在Ubuntu上的Chrome浏览器有效。由于某些原因,它不适用于Chromium。SpeakIt带有两种女性声音,与其他声音相比,它们听起来都非常真实。如果您使用“ TTS”作为查询来搜索Chrome网上应用店,则至少有另外4种男性和女性声音被列出。
用法:用于网站。突出显示要阅读的文本,然后右键单击“ SpeakIt”或单击Chrome顶部栏上停靠的SpeakIt图标。
Firefox用户也有两个选择。在Firefox插件中,搜索TTS,您应该找到“点击讲话”以及“文字转语音”。声音不如Chrome SpeakIt声音好,但绝对可以使用。
SpeakIt扩展程序使用iSpeech技术,该网站可以将文本转换为MP3音频文件,价格为每年20美元。您可以输入文本,URL,RSS提要以及TXT,DOC和PDF等文档,然后输出到MP3。您可以进行播客,嵌入音频等。这是一个链接,以及它们的音频示例(不知道链接将持续多长时间)。
Pico和espeak很有趣,上班也很容易,但是它们并不是那么好。节日的默认声音也不是那么好。但是,Festival是基于方案的语音框架,许多研究人员在其中构建了更好的插件声音。您可以轻松超越库存Ubuntu上的pico2wave质量,因为这些声音之一可以作为现成的软件包获得。
要使音乐节听起来自然,请执行以下操作:
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
您可以使用-b
(或--batch
)在命令行中将每个命令放在单引号中:
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
您可以从Nitech存储库中获得其他相当不错的声音,但是安装它们的过程很繁琐,并且默认路径已更改,因此可能需要手动编辑捆绑的方案文件中的文件名引用才能在库存的Ubuntu上工作。
项目页面的更新(2019-02):该项目当前未维护,在可预见的将来将保持不变
由于缺少更好的选择,我编写了一个bash脚本,该脚本与Michal Fapso的perl脚本接口,以通过Google Translate提供TTS。从项目描述:
目的是提供易于使用的界面,以通过Google的语音合成系统输出文本到语音。如果找不到Internet连接,则使用pico2wave的后备选项会自动提供TTS合成。
就目前而言,包装程序支持从标准输入,纯文本文件和X选择(突出显示的文本)中读取。
主要特点是:
安装和使用情况记录在项目页面上。
如果您尝试一下,我会很高兴。欢迎错误报告和任何其他反馈!
对于高质量的Ubuntu文本到语音,我一直看高低低。空无一人。我的声带瘫痪了,所以我需要TTS向我的Ubuntu视频中添加语音指令。您可以在此处获得商业高质量的Linux文本到语音软件。真的很贵。我最终以40美元的价格购买了适用于Windows的Natural Reader(在Wine下在Ubuntu中不起作用)。也许以后我会得到Linux。
我一直在研究最佳发音和易于调音的文本到语音。以下列出了我认为音质排名前五位的产品。与这些产品相关的大多数网站都有一个交互式演示,您可以自己决定。
我发现节日上的Nitech HTS声音非常自然,比我听到的任何其他声音都令人安慰。有关如何通过音乐节设置Nitech和其他声音的信息,请参见此链接。我没有找到可以用来配置这些声音的好gui,但是可以通过Festival.scm进行设置。该帖子非常老,您可能想使用“ locate Festival”命令找到实际的安装目录。
将SVOX工具(pico)与LibreOffice结合使用:
SVOX(pico)工具易于安装,并在Ubuntu中带来了高质量的声音。安装它:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
您可以通过安装“ Read Text”扩展将LibreOffice与SVOX(pico)工具结合使用,并获得此出色的TTS软件的“ GUI”:
使用工具-附加组件-阅读选择设置阅读文本扩展选项。...使用/ usr / bin / python作为外部程序。选择包含令牌(PICO_READ_TEXT_PY)的命令行选项,您可能要尝试其中的一些。
现在,您只需要在LO Writer,Calc,Impress或Draw中选择一些文本,然后在添加为工具栏的图标(带有气球的笑脸)上单击clic。
这是我为pdf和其他文本文件制作纯自然语音所做的事情(其他解决方案不是自然的,或者仅仅是付费服务)。实际上,这是使用铬或铬的一种解决方法,但是工作快捷且容易。
还有一些方法可以在chrome中打开其他文件(如.doc和.txt)并执行相同的操作。chrome的其他扩展名可以查看pdf文件,请检查它是否更适合您。此外,您可以在Google云端硬盘中上传各种文本,并使用SpeakIt!为您阅读。另一个扩展名为“说文本”,其工作方式相同,并且具有自然的语音表达。
当寻找更好的tts引擎与新的firefox 49叙事模式一起使用时,我发现了pico tts(svox)-我最喜欢的TTS引擎。
sudo apt install espeak libttspico0 libttspico-data libttspico-utils
如何在全系统范围内更改默认语音合成引擎?
人们在Arch Linux的把我带到了正确的道路:
取消注释您喜欢的模块,并在语音分派器设置中将其设为默认值:
# sudo vim /etc/speech-dispatcher/speechd.conf
[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak" "sd_espeak" "espeak.conf"
AddModule "pico-generic" "sd_generic" "pico-generic.conf"
[...]
#DefaultModule espeak
DefaultModule pico-generic
重新启动守护程序:
# sudo systemctl restart speech-dispatcher.service
但是,当再次启动Firefox时,什么也没有发生。根据上面的链接(arch论坛帖子#10和#16)可以与Festival(没有尝试过)配合使用,但是pico的语音分派器没有列出可用的声音。它不会运行。
任何想法将不胜感激;-)
我最喜欢的文本转语音程序称为Magic English,但是就像Joe Steiger提到的Natural Reader一样,它是Windows程序,我不确定它是否可以在Wine下运行。
AT&T Natural Voices可以作为演示在线获取,但这不是解决方案,而是解决方法。
Pico,mbrola,cmu,festival,flite在2017年都很烂(它们在90年代很棒)。AT&T自然语音(很棒)不是linux兼容,也不是免费的,因此我们使用Google
git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
gTTS(Google Text-to-Speech),一个Python库和CLI工具,可与Google Translate的text-to-speech API交互。将语音
mp3
数据写入文件,类似文件的对象(字节串)以进行进一步的音频处理,或stdout
。
缺点:仅CLI。必须在线,因为它需要向Google公开开放端点请求。
sudo -H pip install gTTS # Install
用法
gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -
已经提到了一些
模仿。安装:
sudo apt-get install gcc make pkg-config automake libtool libasound2-dev
git clone https://github.com/MycroftAI/mimic.git # take a while
cd mimic
./dependencies.sh --prefix="/usr/local" # take a while
./autogen.sh
./configure --prefix="/usr/local"
make # take a while
make check
eSpeak + Gespeaker(GUI)(Gespeaker源代码)
缺点:老而丑
sudo apt install espeak gespeaker
为此,我构建了智能扬声器-Google Chrome扩展程序。即使没有选择,它也可以读取页面(正确的文本保留时间)。