适用于Windows的良好的文本语音转换解决方案


9

我正在运行Windows 7,并且我知道它能够在我的应用程序中读取文本,但是我正在寻找一个很好的实用程序将文本块另存为wav文件或mp3。它可能已经内置在OS中,但巧妙地伪装了。我知道我可以编写一个程序来调用API,如果还没有好的解决方案,这就是下一步。

我真的很喜欢AT&T系统的质量,但是在使用生产的MP3方面有一些非常严格的限制。我想在播客中使用它们。

基于Web也是可以的,只要它可以轻松生成相当不受限制的(公共领域或知识共享)Wav,MP3或其他标准音频文件即可。自然,与商业广告相比,我更喜欢免费或开放源代码,但这不是必需的。

Answers:


4

我已经尝试过espeakfestivalMaryTTS。它们大部分都产生可理解的声音,但不是很自然。即使为这些系统(例如Mbrola,CMU Arctic)添加了其他语音下载,声音也不是那么好。

到目前为止,IVONA的声音是我听到的最好的声音。他们会为您提供30天的免费演示,如果您需要一次性完成任务,那就足够了。之后,它们就像$ 45 /语音。亚马逊刚刚收购了这家公司,所以您知道它的实力(http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/)。

它们与Microsoft的SAPI接口配合使用,这意味着支持该程序的任何声音(例如Adobe Reader)都可以使用。我一直在将它们与Text To Wav程序一起使用,该程序非常适合将文本文件批量转换为wave文件。

编辑

实际上,只要重新阅读您的问题,我认为对于非个人用途(例如播客),IVONA的价格可能会高很多。在这种情况下,我想说说MaryTTS。


我只是听了MaryTTS的演讲,它吹响了演讲和音乐节的高潮。
2013年

MaryTTS具有很大的声音,它也是免费的。
Jim McKeeth

似乎由TextAloud
用户

6

eSpeak是免费和开源的,可提供您所需的一切。

它可以作为命令行程序运行,以说出文件或stdin中的文本。
也可以使用共享库版本。

*包括不同的音色,其特征可以更改。
*可以将语音输出生成为WAV文件。
*支持SSML(语音综合标记语言)(不完整),
  还有HTML。
*体积小巧。该程序及其数据,包括多种语言,
  总计约1 MB。
*可以将文本翻译为音素代码,因此可以将其改编为前端
  结束另一个语音合成引擎。
*其他语言的潜力。在不同阶段包括了几个
  的进步。来自母语人士的这些或其他语言的帮助是
  欢迎。
*可用于生成和调整音素数据的开发工具。
*用C ++编写。

尽管eSpeak看起来很有趣,但它确实可以从“快速入门”指南中受益。谢谢你的小费。我会继续努力。
Jim McKeeth,2009年

+1代表eSpeak。我一直在寻找一个应用程序来做到这一点很长时间。谢谢你,先生!
Axxmasterr
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.