适用于Windows的良好的文本语音转换解决方案

9

我正在运行Windows 7，并且我知道它能够在我的应用程序中读取文本，但是我正在寻找一个很好的实用程序将文本块另存为wav文件或mp3。它可能已经内置在OS中，但巧妙地伪装了。我知道我可以编写一个程序来调用API，如果还没有好的解决方案，这就是下一步。

我真的很喜欢AT＆T系统的质量，但是在使用生产的MP3方面有一些非常严格的限制。我想在播客中使用它们。

基于Web也是可以的，只要它可以轻松生成相当不受限制的（公共领域或知识共享）Wav，MP3或其他标准音频文件即可。自然，与商业广告相比，我更喜欢免费或开放源代码，但这不是必需的。

— 吉姆·麦基思
source

4

我已经尝试过espeak，festival和MaryTTS。它们大部分都产生可理解的声音，但不是很自然。即使为这些系统（例如Mbrola，CMU Arctic）添加了其他语音下载，声音也不是那么好。

到目前为止，IVONA的声音是我听到的最好的声音。他们会为您提供30天的免费演示，如果您需要一次性完成任务，那就足够了。之后，它们就像$ 45 /语音。亚马逊刚刚收购了这家公司，所以您知道它的实力（http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/）。

它们与Microsoft的SAPI接口配合使用，这意味着支持该程序的任何声音（例如Adobe Reader）都可以使用。我一直在将它们与Text To Wav程序一起使用，该程序非常适合将文本文件批量转换为wave文件。

编辑

实际上，只要重新阅读您的问题，我认为对于非个人用途（例如播客），IVONA的价格可能会高很多。在这种情况下，我想说说MaryTTS。

— 用户
source

我只是听了MaryTTS的演讲，它吹响了演讲和音乐节的高潮。

— 2013年

MaryTTS具有很大的声音，它也是免费的。

— Jim McKeeth

似乎由TextAloud

— 用户

6

eSpeak是免费和开源的，可提供您所需的一切。

它可以作为命令行程序运行，以说出文件或stdin中的文本。
也可以使用共享库版本。

*包括不同的音色，其特征可以更改。
*可以将语音输出生成为WAV文件。
*支持SSML（语音综合标记语言）（不完整），
  还有HTML。
*体积小巧。该程序及其数据，包括多种语言，
  总计约1 MB。
*可以将文本翻译为音素代码，因此可以将其改编为前端
  结束另一个语音合成引擎。
*其他语言的潜力。在不同阶段包括了几个
  的进步。来自母语人士的这些或其他语言的帮助是
  欢迎。
*可用于生成和调整音素数据的开发工具。
*用C ++编写。

— 约翰·T
source

尽管eSpeak看起来很有趣，但它确实可以从“快速入门”指南中受益。谢谢你的小费。我会继续努力。

— Jim McKeeth，2009年

+1代表eSpeak。我一直在寻找一个应用程序来做到这一点很长时间。谢谢你，先生！

— Axxmasterr