听起来自然发短信吗?


Answers:


51

SVOX pico2wave

一个非常简约的TTS,听起来比espeak或mbrola更好。一些信息在这里

我不明白为什么pico2wave与espeak或mbrola相比很少讨论。它很小,但听起来确实不错(自然)。未经修改,您将听到自然的女性声音。

AND ...与Mbrola相比,它可以识别单位并以正确的方式说话!
例如:

  • 2°C→2度
  • 2m→两米
  • 2kg→2公斤

安装后,我在脚本中使用它:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

然后使用所需的文本运行它:

<scriptname>.sh "hello world"

或读取整个文件的内容:

<scriptname>.sh "$(cat <filename>)"

在Ubuntu上拥有轻巧,稳定的TTS就是所有这些。


1
据我所知,它仅使用cli参数作为输入。有什么办法可以使pico2wave从文件名读取文本?
2014年

13
pico2wavelibttspico-utils在最新版本的ubuntu 中已打包。@CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
naught101

1
@CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)"=)。同意此CLI界面设计不当:与绝大多数的CLI不同,它可能达到OS的最大CLI参数长度
Ciro Santilli新疆改造中心法轮功六四事件

1
@Koen我不知道!:-)像其他任何问题一样,尝试给出一个简单的例子,例如,使用echo {1..1000}
Ciro Santilli新疆改造中心法轮功六四事件

1
@ user49557我们不应该劫持他人的问题,因此也许您可以创建一个新问题,说明您确切安装了什么以及出了什么问题,然后我可以随时为您提供帮助(尽管不能保证) ,我不是专家:P)
Koen 2015年

22

说话吧!

我相信Ive使用名为“ SpeakIt”的Google Chrome扩展程序免费找到了最好的TTS软件。这仅对我在Ubuntu上的Chrome浏览器有效。由于某些原因,它不适用于Chromium。SpeakIt带有两种女性声音,与其他声音相比,它们听起来都非常真实。如果您使用“ TTS”作为查询来搜索Chrome网上应用店,则至少有另外4种男性和女性声音被列出。

用法:用于网站。突出显示要阅读的文本,然后右键单击“ SpeakIt”或单击Chrome顶部栏上停靠的SpeakIt图标。


Firefox用户也有两个选择。在Firefox插件中,搜索TTS,您应该找到“点击讲话”以及“文字转语音”。声音不如Chrome SpeakIt声音好,但绝对可以使用。

SpeakIt扩展程序使用iSpeech技术,该网站可以将文本转换为MP3音频文件,价格为每年20美元。您可以输入文本,URL,RSS提要以及TXT,DOC和PDF等文档,然后输出到MP3。您可以进行播客,嵌入音频等。这是一个链接,以及它们的音频示例(不知道链接将持续多长时间)。


3
不幸的是,所有浏览器选项均不适用于PDF文件。你碰到了一个吗?我希望能够选择要从PDF中读取的段落(即不必将位粘贴到终端或其他位置)
James Owers,2016年

1
这个扩展适用于我使用Debian 8.4的铬50.0.2661.94,它很棒!我特别喜欢英语的女性声音。我唯一的抱怨就是逗号暂停时间太长。
mulllhausen

它通常会误读单词,并且花费时间将文本发送到单独的服务器,而不是仅使用您自己的系统。
哥达德

14

Pico和espeak很有趣,上班也很容易,但是它们并不是那么好。节日的默认声音也不是那么好。但是,Festival是基于方案的语音框架,许多研究人员在其中构建了更好的插件声音。您可以轻松超越库存Ubuntu上的pico2wave质量,因为这些声音之一可以作为现成的软件包获得。

要使音乐节听起来自然,请执行以下操作:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

您可以使用-b(或--batch)在命令行中将每个命令放在单引号中:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

您可以从Nitech存储库中获得其他相当不错的声音,但是安装它们的过程很繁琐,并且默认路径已更改,因此可能需要手动编辑捆绑的方案文件中的文件名引用才能在库存的Ubuntu上工作。


2
顺便说一句,在Ubuntu 16.04中,似乎缺少此软件包。您可以从Debian下载并安装Deb,它可以正常工作:packages.debian.org/sid/all/festvox-us-slt-hts/download sudo dpkg -i Downloads / festvox-us-slt-hts_0.2010.10。 25-2_all.deb
乔恩·

13

简单的Google™TTS

项目页面的更新(2019-02)该项目当前未维护,在可预见的将来将保持不变


由于缺少更好的选择,我编写了一个bash脚本该脚本与Michal Fapso的perl脚本接口,通过Google Translate提供TTS。从项目描述:

目的是提供易于使用的界面,以通过Google的语音合成系统输出文本到语音。如果找不到Internet连接,则使用pico2wave的后备选项会自动提供TTS合成。

就目前而言,包装程序支持从标准输入,纯文本文件和X选择(突出显示的文本)中读取。

主要特点是:

  • 通过Google翻译进行在线TTS综合
  • 通过pico2wave进行离线TTS合成
  • 支持多种不同的语言
  • 可以从CLI,文本文件和突出显示的文本中读取
  • 支持阅读具有固定格式的突出显示的文本(例如PDF文件)

安装和使用情况记录在项目页面上

如果您尝试一下,我会很高兴。欢迎错误报告和任何其他反馈


这必须是我见过的最酷的项目之一。哇 😲

5
这不再被维护。
Goddard

8

对于高质量的Ubuntu文本到语音,我一直看高低低。空无一人。我的声带瘫痪了,所以我需要TTS向我的Ubuntu视频中添加语音指令。您可以在此处获得商业高质量的Linux文本到语音软件。真的很贵。我最终以40美元的价格购买了适用于Windows的Natural Reader(在Wine下在Ubuntu中不起作用)。也许以后我会得到Linux。


花花公子,有,而且我像上周一样在使用它,至少有5或6,现在我无法终生找到他们中的任何一个,得爱我们的社区
mchid

Textaloud上有说明要使其产品在葡萄酒下工作。参见nextup.com/forum/viewtopic.php?t=3349 我相信cepstral也有一个Linux端口。我无法获得我最喜欢的软件balabolka。我安装的Windows 10主要用于TTS处理。戴维森女士很好,与后频谱大卫类似。现有一个是免费的,如果您有Windows 10
比丘须菩提

6

我一直在研究最佳发音和易于调音的文本到语音。以下列出了我认为音质排名前五位的产品。与这些产品相关的大多数网站都有一个交互式演示,您可以自己决定。

  1. NeoSpeech
  2. iVona
  3. 阿卡佩拉
  4. AT&T自然之声
  5. CereProc声音

1
有可用的linux吗?我不这么认为
Mehdi Khademloo 2016年

5

我发现节日上的Nitech HTS声音非常自然,比我听到的任何其他声音都令人安慰。有关如何通过音乐节设置Nitech和其他声音的信息,请参见此链接。我没有找到可以用来配置这些声音的好gui,但是可以通过Festival.scm进行设置。该帖子非常老,您可能想使用“ locate Festival”命令找到实际的安装目录。


似乎很好。在此处找到演示cstr.ed.ac.uk/projects/festival/onlinedemo.html
Iacchus 2014年

2
是的,Nitech声音比节日音乐节的声音要高得多(除了CMU声音,声音也非常好。)可惜的是它们很难安装。有一个很好的CMU语音,它在Ubunut中有一个默认软件包,称为cmu_us_slt_arctic_hts,并在软件包festvox-us-slt-hts中。它比pico或espeak好得多!
乔恩·瓦特

5

将SVOX工具(pico)与LibreOffice结合使用:

SVOX(pico)工具易于安装,并在Ubuntu中带来了高质量的声音。安装它:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

您可以通过安装“ Read Text”扩展将LibreOffice与SVOX(pico)工具结合使用,并获得此出色的TTS软件的“ GUI”:

使用工具-附加组件-阅读选择设置阅读文本扩展选项。...使用/ usr / bin / python作为外部程序。选择包含令牌(PICO_READ_TEXT_PY)的命令行选项,您可能要尝试其中的一些。

现在,您只需要在LO Writer,Calc,Impress或Draw中选择一些文本,然后在添加为工具栏的图标(带有气球的笑脸)上单击clic。


4

这是我为pdf和其他文本文件制作纯自然语音所做的事情(其他解决方案不是自然的,或者仅仅是付费服务)。实际上,这是使用铬或铬的一种解决方法,但是工作快捷且容易。

  1. 安装SpeakIt!扩展您的铬或铬。
  2. 如果您使用的是铬(铬已经免费提供pdf查看器),请安装PDF Viewer,并在铬的扩展名设置中选中“允许以隐身方式使用”和“允许访问文件URL”选项。
  3. 将pdf拖放到浏览器。
  4. 现在突出显示一些文本,然后右键单击并选择SpeakIt!因此您可以听纯自然的语音合成。

还有一些方法可以在chrome中打开其他文件(如.doc和.txt)并执行相同的操作。chrome的其他扩展名可以查看pdf文件,请检查它是否更适合您。此外,您可以在Google云端硬盘中上传各种文本,并使用SpeakIt!为您阅读。另一个扩展名为“说文本”,其工作方式相同,并且具有自然的语音表达。


您能否详细说明如何让SpeakIt读取保存在Google云端硬盘中的pdf文件?
Marco Lackovic 2014年

2

当寻找更好的tts引擎与新的firefox 49叙事模式一起使用时,我发现了pico tts(svox)-我最喜欢的TTS引擎。

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

如何在全系统范围内更改默认语音合成引擎?

人们在Arch Linux的把我带到了正确的道路:

取消注释您喜欢的模块,并在语音分派器设置中将其设为默认值:

# sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

重新启动守护程序:

# sudo systemctl restart speech-dispatcher.service

但是,当再次启动Firefox时,什么也没有发生。根据上面的链接(arch论坛帖子#10和#16)可以与Festival(没有尝试过)配合使用,但是pico的语音分派器没有列出可用的声音。它不会运行。

任何想法将不胜感激;-)


1

我最喜欢的文本转语音程序称为Magic English,但是就像Joe Steiger提到的Natural Reader一样,它是Windows程序,我不确定它是否可以在Wine下运行。

AT&T Natural Voices可以作为演示在线获取,但这不是解决方案,而是解决方法。


1

简单的Google™TTS

Pico,mbrola,cmu,festival,flite在2017年都很烂(它们在90年代很棒)。AT&T自然语音(很棒)不是linux兼容,也不是免费的,因此我们使用Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -

这是谷胱甘肽答案的重复(该项目的作者)。另外:“状态更新:该项目目前未维护,在可预见的将来将保持不变。” 他提出了一些替代方案
Pablo A

1

交易

gTTSGoogle Text-to-Speech),一个Python库和CLI工具,可与Google Translate的text-to-speech API交互。将语音mp3数据写入文件,类似文件的对象(字节串)以进行进一步的音频处理,或stdout

缺点:仅CLI。必须在线,因为它需要向Google公开开放端点请求。

sudo -H pip install gTTS  # Install

用法

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

文档和更多示例

其他

已经提到了一些


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.