这不只是评论,而是答案。
质量取决于几件事,包括(如Aaron所说)1)语言对和2)主题,还有3)属词和4)原始样式,以及5)您拥有的并行文本的数量训练机器翻译系统。
首先,实际上,这些天所有MT都是基于平行文本,即两种不同语言的文本,其中一种可能是另一种的翻译(或两者都是某种第三种语言的翻译);当平行文本不包含特定单词时,可能会使用字典(可能由形态过程辅助)作为退避。
而且,正如其他人所说的,MT系统完全无法理解其翻译的文本。它只看到字符串和由字符组成的单词序列,并且在之前翻译过的文本中查找相似的字符串和序列。(好吧,它比这稍微复杂一点,并且已经尝试过在计算系统中获取语义,但是目前主要是字符串。)
1)语言各不相同。某些语言有很多形态,这意味着它们用一个单词来做事,而其他语言则用几个单词来做事。一个简单的例子是西班牙语“ cantaremos” =英语“我们将唱歌”。一种语言可能会做另一种语言不会困扰的事情,例如西班牙语中的非正式/正式(tu / usted)区别,而英语则没有同等的区别。或者,一种语言可能会执行某种形态上的事情,而另一种语言可能会使用词序。或者,该语言使用的脚本甚至可能没有标记单词边界(中文和其他一些词)。两种语言之间的差异越大,MT系统在它们之间进行翻译的难度就越大。统计MT的第一个实验是在法语和英语之间进行的,
2)主题:如果您在圣经中有平行文本(几乎所有成对的书面语言都是如此),并且您从中训练了MT系统,请不要指望它在工程文本上能很好地发挥作用。(好吧,按照训练机器翻译系统的标准来看,圣经是相对较少的文本,但假装:-)。)圣经的词汇与工程学的词汇有很大不同,各种语法的频率也是如此建筑。(语法本质上是相同的,但是例如在英语中,科学和工程学文本中会出现更多的被动语态和更多复合名词。)
3)属:如果您的平行文本都是声明性的(例如拖拉机手册),则尝试在对话框上使用生成的MT系统将不会获得良好的结果。
4)风格:想想希拉里和唐纳德;博学与流行。在一个方面进行培训不会在另一个方面取得良好的效果。同样,培训成人系统小说的MT系统并在儿童书籍上使用MT系统。
5)语言对:英语有很多文本,并且找到与给定英语文本平行的其他某种语言的文本的机会比在俄语和伊博语中找到平行文本的机会要高得多。(也就是说,可能会有例外,例如印度的语言。)作为一种概括,训练MT系统所需的并行文本越多,效果越好。
总而言之,语言很复杂(这就是为什么我喜欢它-我是语言学家)。因此,MT系统并不总是能正常工作也就不足为奇了。
顺便说一句,人工翻译也不总是那么好。一两年前,我正在将翻译人员的文档翻译成英语,以用作MT系统的培训材料。有些翻译难以理解,在某些情况下,我们是从两名(或更多)人工翻译那里获得翻译的,因此很难相信这些翻译在阅读相同的文档。
最后,(几乎)永远不会只有一种正确的翻译。翻译段落有多种方法,根据您想要的功能(语法正确性,样式,用法的一致性等),或多或少会比较好。没有“准确性”的简单度量。