Answers:
我已经尝试过espeak,festival和MaryTTS。它们大部分都产生可理解的声音,但不是很自然。即使为这些系统(例如Mbrola,CMU Arctic)添加了其他语音下载,声音也不是那么好。
到目前为止,IVONA的声音是我听到的最好的声音。他们会为您提供30天的免费演示,如果您需要一次性完成任务,那就足够了。之后,它们就像$ 45 /语音。亚马逊刚刚收购了这家公司,所以您知道它的实力(http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/)。
它们与Microsoft的SAPI接口配合使用,这意味着支持该程序的任何声音(例如Adobe Reader)都可以使用。我一直在将它们与Text To Wav程序一起使用,该程序非常适合将文本文件批量转换为wave文件。
编辑
实际上,只要重新阅读您的问题,我认为对于非个人用途(例如播客),IVONA的价格可能会高很多。在这种情况下,我想说说MaryTTS。
eSpeak是免费和开源的,可提供您所需的一切。
它可以作为命令行程序运行,以说出文件或stdin中的文本。 也可以使用共享库版本。 *包括不同的音色,其特征可以更改。 *可以将语音输出生成为WAV文件。 *支持SSML(语音综合标记语言)(不完整), 还有HTML。 *体积小巧。该程序及其数据,包括多种语言, 总计约1 MB。 *可以将文本翻译为音素代码,因此可以将其改编为前端 结束另一个语音合成引擎。 *其他语言的潜力。在不同阶段包括了几个 的进步。来自母语人士的这些或其他语言的帮助是 欢迎。 *可用于生成和调整音素数据的开发工具。 *用C ++编写。