主页 / 社会 > 教育 > 正文

谷歌翻译被指欠缺理解力 经4种语言测试

2018-02-24 02:31:18   来源:科技生活在线   评论:0   [收藏]   [评论]
导读:小编按:以英语、法语、德语和中文进行测试,最后得出结论:“谷歌翻译”和相关技术的实用性是毋庸置疑的,总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西,一言以蔽之:理解力。

  新智元导读:科普神人侯世达怀疑谷歌翻译是否成为替代人类译者的颠覆者,以英语、法语、德语和中文进行测试,最后得出结论:“谷歌翻译”和相关技术的实用性是毋庸置疑的,总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西,一言以蔽之:理解力。

  本文原文标题为:《The Shallowness of Google Translate》,刊载于2018年1月30日《大西洋月刊》。作者侯世达怀疑谷歌翻译是否成为替代人类译者的颠覆者,以英语、法语、德语和中文进行测试,最后得出结论:“谷歌翻译”和相关技术的实用性是毋庸置疑的,总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西,一言以蔽之:理解力。

  科普神人4种语言测试谷歌翻译,结论:缺乏理解力

  某个周日,在我们每周一次的莎莎舞会上(salsa sessions),我的朋友弗兰克带了一个丹麦朋友来。我知道弗兰克的丹麦语讲得很好,因为他的母亲是丹麦人,他小时候曾在丹麦生活过。而他带来的那个朋友,跟所有斯堪的纳维亚人一样,能讲一口流利的英语。然而,令我惊讶的是,在晚上闲聊的过程中,他们居然习惯性地用“谷歌翻译”交换信息。弗兰克用英文写下文字,然后用“谷歌翻译”转译成丹麦语;而他的朋友则用丹麦语写下文字,然后用“谷歌翻译”转译成英语。这太奇怪了!为什么会讲对方语言的两个聪明人要用这种方式沟通呢?我对机器翻译的体验总是让我对它不够信任。但这两个朋友显然没有我的那种疑虑。实际上,很多受过良好教育的人对于机器翻译都抱有相当大的热情,很少对它产生质疑。这让我颇感困惑。

  作为一个语言爱好者和翻译热爱者,作为一个认知科学家和一个人类精妙心智的终身敬畏者,几十年来我一直在关注机器翻译的进展。当我最初在1970年代对它产生兴趣时,我读过一封信,是数学家、机器翻译早期倡议者沃伦·韦弗(Warren Weaver)于1947年写给控制论专家诺伯特·维纳(Norbert Wiener)的。在信中,韦弗写了一句很有意思的话,今天仍为众人所熟知:

  当我阅读用俄罗斯语写的文章时,我会对自己说,“这篇文章实际上是用英语写的,只不过被编码成了一些奇怪的符号。现在,我要把这些符号解码回来。”

  几年后,他表达了不同的看法:“没有一个理性的人会认为,机器翻译能够做到‘信、雅、达’。普希金不需要为此感到担忧。” 哈!我曾用了我人生中整整一年的时间,将亚历山大·普希金的著名诗体小说《叶甫盖尼·奥涅金》翻译成我的母语(也即是,把这一伟大的俄罗斯文学作品重新翻译成英文诗体小说),这真是一段令我难忘的经历。我发现维纳的新观点揭示了语言朴素的本质,更接近于语言的真相。尽管如此,他在1947年提出的“翻译即解码”的观点还是成为了机器翻译领域的一种信仰。

  从那以后,“翻译机器”逐渐有了发展。直到最近,对所谓“深度神经网络”的使用,让有些观察家(参见纪德·刘易斯-克劳斯(Gideon Lewis-Kraus)在《纽约时报杂志》上发表的《The Great AI Awakening》,以及雷恩·格林(Lane Greene)在《经济学人》上发表的《Machine Translation: Beyond Babel》)宣称,人类译者将成为濒危物种。照此发展下去,用不了几年,人类译者要做的事情就不是创造新的文本了,而是对文本进行修修补补和质量控制。

  果真如此的话,这将对我的精神生活造成巨大的冲击。虽然我完全理解人们对机器翻译的痴迷,但我肯定属于最不希望人类译者被无情的机器所取代的那类人。事实上,机器翻译令我感到恐惧和厌恶。在我看来,翻译是一种难以置信的精妙艺术,它需要译者有丰富的人生阅历和创造性的想象力。如果真有那么一天,人类译者成了历史的遗迹,我对人类心智的敬畏就会受到动摇,这种动摇会让我陷入可怕的困扰和无尽的悲伤之中。

  每当我读到文章宣称,人类译者作为一个群体将很快向新技术的快刀利剑俯首称臣时,我总有一种想要亲自检验这种判断的冲动,这一方面是因为,我感到技术替代的魔魇可能近在眼前;另一方面是因为,我由衷希望自己能够确证,危险并非迫在眉睫;最后,出于我一贯的信念,我想要挑战那些夸大其词的人工智能威胁论。

  人工神经网络并不是一项新奇的技术。最近,在谷歌内部被称为“谷歌大脑”(Google Brain)的部门采用了这项技术,同时,又用“深度学习”增强了它的能力。我阅读了相关文献,了解了被称为革命性翻译机器的软件机理,然后,我决定亲自测试最新版本的“谷歌翻译”。它真的是一个颠覆者吗,就像“深蓝”和“AlphaGo”之于象棋和围棋那样?

  我发现,虽然“谷歌翻译”的老版本可以处理多种语言,但新的深度学习版本目前只能处理9种语言。(最新情况是,它可以处理96种了。)其中,我只打算测试英语、法语、德语和中文。

  在展现测试结果之前,我应当指出,“深度”这一形容词的含义是模糊不清的。当人们听说谷歌买了一家名叫DeepMind的公司,其产品使用了用“深度学习”技术增强的“深度神经网络”时,下意识中会将“深度”一词理解为“深刻”,进而理解为“强大”、“颖悟”、“聪明”。然而,这里的“深度”仅仅是指这样一个事实:新的神经网络比老的神经网络拥有更多的层次,比如说,前者有12层,后者只有2、3层。那么,这种层级数量的差异是否意味着,神经网络必然会更聪明呢?并非如此,这不过是语义上的误解。

  “谷歌翻译”的宣传声势浩大,但我对它却持有谨慎态度。尽管对它并无好感,但我也意识到它的确带来了一些惊喜。它对地球上的每个人都是免费的,能够将差不多100种语言转译成任何一种其他语言。这真是一件了不起的成就。如果我可以骄傲地称自己是“三种全会”(pi-lingual)的话[1](如果有人问我“你会说几种语言”,我会很愉快地回答,大概会3种语言),那么“谷歌翻译”得有多骄傲啊,毕竟,它可以把自己称为“百种全会”(bai-lingual)(“百”在中文里是指数字“100”)。对于只会3种语言的人来讲,会100种语言简直难以想象。并且,如果我将一张语言A的文字复制粘贴,放进“谷歌翻译”,不消几秒钟,它就能被翻译成语言B。在数种语言之间自由转换,这种效果在任何地方任何屏幕上都能实现。

  “谷歌翻译”和相关技术的实用性是毋庸置疑的,总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西,一言以蔽之:理解力。机器翻译绝对做不到理解语言。相反,它的方法只是试图去“解码”——而不去考虑究竟什么是理解和意义。那么,是否不需要理解就能做好翻译呢?某种事物——人类或机器——能在完全不理解语言的情况下拿出高品质的翻译作品吗?为了回答这个问题,现在我要谈及我所做过的几个实验。

  ? ? ? ?

  我的实验最先是从小处着手的。我使用了下面这段简短的话,人类的心智能够对它产生清晰的画面感:

  In their house, everything comes in pairs. There’s his car and her car, his towels and her towels, and his library and hers.

  在他们的房间里,每样东西都是成对出现的。有他的车,就有她的车;有他的毛巾,就有她的毛巾;有他的书房,就有她的书房。

  这段话翻起来似乎是很容易的,然而在法语中(以及在其他拉丁语系中),“他”和“她”这样的性别词汇不是由事物的所有者来界定的,而是由事物本身来界定的[2]。于是,“谷歌翻译”呈现给我们的结果就是:

  Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et les siennes.

  在他们的房间里,每样东西都是成对出现的。有他的车,就有他的车;有她的毛巾,就有她的毛巾;有他的书房,就有他们。

  这样的结果在我预料之中。它没能意识到,我的这段话描述的是一对夫妻,强调了丈夫(他)拥有的每一样东西,他的妻子(她)也拥有。例如,深度学习引擎用了“sa”(他的)这个词来表示“他的车”和“她的车”,因此,你无法知道车主的性别。类似地,它还用了无性别的复数词“ses”来表示“他的毛巾”和“她的毛巾”。至于最后提到的两个书房(他的和她的),它则干脆省掉了“hers”中的“s”,认为“s”在这里表示复数,意指“他们”(“les siennes”)[3]。可以说,在翻成法文的时候,“谷歌翻译”完全领会错了意思。然而,每一个人类读者都能正确理解这段话的言外之意。

  接下来,我自己把这段话翻成了法文,正确表达了全部意思。以下是我的法文版本:

  Chez eux, ils ont tout en double. Il y a sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui.[4]

  “sa voiture à elle”表示“她的车”,而“sa voiture à lui”只能被理解为“他的车”。这时,我猜想“谷歌翻译”应该很容易把我的法文版本准确翻回到英文,但我完全想错了。下面是它呈现给我的结果:

  At home, they have everything in double. There is his own car and his own car, his own towels and his own towels, his own library and his own library.

  在家里,他们的每样东西都有两个。有他自己的车和他自己的车,他自己的毛巾和他自己的毛巾,他自己的书房和他自己的书房。

  这都什么鬼啊?!即便输入的语句专门强调了物主的性别,翻译机器还是忽略了这一点,把所有性别都翻成了男性。为什么它会丢掉如此重要的信息呢?

  我们人类都知道,什么是夫妻、房屋、个人物品、骄傲、竞争、嫉妒、隐私,以及很多其他似乎难以理解的怪癖,比如,结了婚的夫妻,各自的毛巾也要分别刺上“他的”和“她的”字样。而“谷歌翻译”却不明就里,或者准确地说,它暂时还不明就里。它只熟悉由字母所组成的字符串,只知道以超快的速度处理一段段文字,而不知道如何思考、想象、记忆和理解这些文字。它甚至不知道文字指涉了事物。我可以毫不犹豫地说,理论上讲,计算机程序本可以理解语言的用途,可以拥有思想、记忆和经验,可以应用它们。然而,“谷歌翻译”却不是为了这些目的而设计的,设计人员甚至根本没有这样的野心。

  好吧,我对它的这些糟糕表现窃喜不已,并感到一丝宽慰,毕竟,人类译者还不会很快被机器所取代。但我还是认为,我应该更深入地了解这部机器,毕竟,一口水,不解渴(one swallow does not thirst quench)。

  事实上,“one swallow does not thirst quench”(也意指“一燕不成夏”(one swallow does not a summer make))这句话是我生造的,我忍不住想要试试,“谷歌翻译”会怎么翻呢?反馈给我的结果如下:“Une hirondelle n’aspire pas la soif.”这是一个符合语法的法文句子,但它的意思很费解。首先,它提到了一种鸟(“une hirondelle”——一种燕子),然后,它又说这种鸟不能吸气,或者不能吮吸(n’aspire pas),最终的意思就是说,这种既不吸气又不吮吸的东西口渴了(la soif)。显然,“谷歌翻译”没有理解我的意思,它只是生成了一堆胡言乱语。“Il sortait simplement avec un tas de taureau.”“He just went out with a pile of bulls.”(他只是说了一堆胡话。)“Il vient de sortir avec un tas de taureaux.”[5]要么我的法语水平有限,要么“谷歌翻译”生成的文字就是伪法语。

  ? ? ? ?

  现在,让我们从法语的“油锅”跳到德语的“火坑”。最近,我迷上了奥地利数学家卡尔·西格蒙德(Karl Sigmund)写的《Sie nannten sich der Wiener Kreis》(人们把他们称为“维也纳学派”)一书。它讲述了维也纳的一群理想主义知识分子在1920年代和1930年代的故事,这群人对20世纪的哲学和科学产生了巨大影响。我选择了书中的一小段文字来考验“谷歌翻译”。我将先呈现德语原文,然后给出我自己的翻译版本,最后给出“谷歌翻译”的版本。(顺便提一句,有两个母语是德语的人核对了我的翻译,包括卡尔·西格蒙德,因此,我认为你大可相信我的翻译是准确的。)

  西格蒙德:

  Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inzwischen die Mehrheit in der Fakult?t, gewisserma?en als ihre Pflicht an, die Hochschulen vor den “Ungeraden” zu bewahren; am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und Wissenschaftlerinnen kamen sowieso nicht in frage; über wenig war man sich einiger.

  侯世达:

  After the defeat, many professors with Pan-Germanistic leanings, who by that time constituted the majority of the faculty, considered it pretty much their duty to protect the institutions of higher learning from “undesirables.” The most likely to be dismissed were young scholars who had not yet earned the right to teach university classes. As for female scholars, well, they had no place in the system at all; nothing was clearer than that.

  战败之后,泛德国主义在当时的教职员工中是主流倾向,很多持有这种倾向的教授认为,自己完全有责任让高等教育机构免受“政治上不受欢迎的人”的影响。最有可能被开除的是青年学者,他们还没有获得在大学授课的教职。对于女性学者而言,她们在大学里更是没有立足之地,这是再明显不过的事实了。

  谷歌翻译:

  After the lost war, many German-National professors, meanwhile the majority in the faculty, saw themselves as their duty to keep the universities from the “odd”; Young scientists were most vulnerable before their habilitation. And scientists did not question anyway; There were few of them.

  战败之后,很多德国籍的教授,同时也是教职员工中的多数派,认为自己有责任让大学避免“奇数”;在获得资格之前,青年科学家是最容易受到影响的。总之,科学家没有产生质疑,几乎没有了。

  “谷歌翻译”呈现的都是英文词汇(然而,不清楚是什么原因,有两个大写字母没用对地方)。除此之外,似乎还过得去。然而,很快你就会发现不对劲了,越往下读,问题越大。

  首先,我注意到了“odd”这个词。它对应了德文中的“die ‘ungeraden’”,意思是“政治上不受欢迎的人”。然而,“谷歌翻译”有理由——出于非常简单的统计学上的理由——选择“odd”这个词。也即是说,在其上百种语言的数据库中,“ungerade”这个词总是被译作“奇数”(odd)。尽管机器本身并不知道为什么会这么翻,但我可以告诉你原因何在。这是因为“ungerade”的意思——字面意思是“不平的”或“不均匀的”——几乎总是意指“不能被2除尽”。而我的翻译版本有意选择了“undesirables”一词,从而使得对“Ungeraden”一词的翻译与统计概率无关,而是来自于我对语境的理解——来自于我注意到文字中没有被清晰表达出来的含义,而且“ungerade”的这种含义绝不可能在我自己的德语词典中找到。

  让我们再来看看“Habilitation”这个德语词汇,它意指大学的教职,相当于终身教授。英文里也有同样词根的词“habilitation”,不过它很少被使用,自然也不会让人联想到终身教授或者类似的事物。所以,我需要简单解释而不只是引用这个含义模糊的词。机器翻译不可能真正理解以英文为母语的读者,“谷歌翻译”当然也做不到这一点,因为它不能模仿读者的知识。

  不过,最后两句话才真正表明了,为什么理解对于翻译而言至关重要。德语名词“Wissenschaftler”由15个字母组成,意思是“科学家”或“学者”。(我选择了后者,因为在文中的语境下,它意指一般意义上的知识分子,而“谷歌翻译”则没能理解这一细微之处。)另一个与此相关的词“Wissenschaftlerin”由17个字母组成,我们可以在最后一句话中看到其复数形式“Wissenschaftlerinnen”,它是一个指代了性别的德语名词。单数名词在语法上指代男性,意指男性学者,复数名词指代女性,只适用于女性学者。我自己的翻译版本用了“女性学者”(female scholar)来理解这层意思。而“谷歌翻译”并没有理解增加了“in”这个后缀的阴性词是最后这句话的核心意义所在。由于它没能意识到“女性”这层意思,就只能再次使用“科学家”这个词,因此没有理解整句话的意思。就像前面的法语例子一样,“谷歌翻译”完全不理解,这段德文的中心意思是要比较男性学者和女性学者的不同境况。

  除开这个错误,最后一句话的余下部分也是翻得一塌糊涂。先看前半部分。“总之,科学家没有产生质疑”(scientists did not question anyway)是对“对于女性学者而言,她们在大学里更是没有立足之地”(Wissenschaftlerinnen kamen sowieso nicht in frage)的正确翻译吗?显然,它没能呈现出原文的意思——甚至完全挨不上边。它只是随意地将德语词汇翻成了英语词汇。这样的结果可以被贴上“翻译”的标签吗?

  这个句子的后半部分同样是错译的。最后6个德语词汇的字面意思是,“没有更多的共识了”,或者更直白一点,“这就是人们达成的最大共识了”。然而,“谷歌翻译”却将这句意思很明确的话翻成了“几乎没有了”。作为人类的我们可能会问“几乎没有什么了?”但翻译机器是不会关心这个问题的。“谷歌翻译”对于语境完全不理解,因此它甚至不能回答看上去很简单的问题。翻译引擎不能想象数量的大小或者事物的数量。它只是把数字翻出来,并没有意识到这些数字象征了某些事物。

  人类有着丰富的人生阅历,也能赋予语言以意义,因此很难察觉到“谷歌翻译”呈现在屏幕上的文字是漏洞百出的。人们几乎会不假思索地认为,一款能如此流畅地翻译语言的软件一定能够理解文字的含义。这种典型的幻觉与人工智能有关,被称为“伊莉莎效应”(ELIZA effect),它迷幻了人们的双眼,让人们误以为机器可以理解英语。时光回到1960年代,研究人员设计了一个被称为“伊莉莎”的虚假的语言机器人,并把它假扮成了一个精神治疗师。“伊莉莎”让每一个与它打过交道的人产生了一种奇怪的感觉:它能够深刻理解人们心灵深处的感受。

  几十年来,颇有见识的人们——甚至一些人工智能的研究人员——也陷入了“伊莉莎效应”。为了确保我的读者避开这一陷阱,让我从前面的段落中引用一些词组——也即是,“‘谷歌翻译’没有理解能力”,“它不能意识到”,“‘谷歌翻译’没有最起码的想法”。然而悖论之处在于,这些词组一直在说“谷歌翻译”欠缺理解力,而这同时又意味着,它至少在有些时候应该具备理解一个单词、一个词组或一句话的含义或所指事物的能力。但事实并非如此。“谷歌翻译”绕开或回避了对语言的理解。

  对我而言,“翻译”这个词散发着神秘而振奋的光芒。它代表了一种深刻的人类艺术形式,能够优雅地将用语言A表达的清晰思想转化成用语言B表达的清晰思想。而这种转化的桥梁不仅仅要确保清晰性,还要呈现出原作者的品味、癖好和写作风格。当我在做翻译的时候,我首先会仔细阅读原文,尽可能准确理解文中的内容,让它们在我脑海中来回酝酿。这不是说让原文中的词句来回酝酿,而是让原文中的思想激荡起其他相关的思想,从而在我脑海中创造出与这些场景相关的美妙光环。不消说,这些光环大多是无意识的。只有当这种光环在我脑海中被成功激发出来时,我才会试图去用另一种语言将它表达出来——让它“喷薄而出”。我希望能用语言B将那种光环表达出来。

  简而言之,我并不是简单地将语言A中的单词和词组转化成语言B中的单词和词组,而是要在无意识中将图像、场景、思想呈现出来,发掘出我自己的人生经历(或者读过的书籍、看过的电影、朋友的教诲),只有当这些非语言的、想象的、体验的、心灵的“光环”被感受到的时候——只有当晦暗不明的意义泡沫漂浮在我脑海中时——我才会开始用另一种语言来书写词汇和语句,然后,修改,修改,再修改。这一通过理解语言来实现的过程似乎显得过于笨拙。事实上,跟“谷歌翻译”2、3秒就能翻出一个页面的速度相比,情况的确如此——但这正是严肃的人类译者应该做的事情。每当我听到那个令人亢奋的术语“深度心智”(deep mind)时,我所想到的正是上述场景。

  现在,我要转向对中文翻译的测试,这对深度学习软件的挑战比前两种欧洲语言要大得多。我的测试材料来自令人温暖的回忆录《我们仨》,作者是中国剧作家和翻译家杨绛,她刚去世没几年,享年104岁。该书讲述了她、她的丈夫钱钟书(也是一个小说家和翻译家)和她女儿跌宕起伏的人生。这本书的文字并不晦涩,但中文用语很规范。我选择了其中一小段,让“谷歌翻译”来完成。以下是翻译结果和我自己的翻译(已经过母语为中文的人的审校):

  杨绛:

  钟书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。他仍兼管研究生。

  毛选翻译委员会的领导是徐永煐同志。介绍钟书做这份工作的是清华同学乔冠华同志。

  事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,钟书惶恐地对我说:

  他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

  侯士达:

  After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.

  The leader of the translation committee of Mao’s works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.

  On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:

  “He thought I was going to become a ‘South Study special aide.’ This kind of work is not easy. You can’t hope for glory; all you can hope for is to do it without errors.”

  谷歌翻译:

  After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.

  The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.

  On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:

  He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

  我将简要指出一些谬误之处。首先,“谷歌翻译”完全没有提到“钟书”这个名字,而它在原文中出现过3次。翻译机器首先用了代词“他”,然后又用了“这本书”(the book),接着又说“惶恐的书在书中”(the book of fear in the book)。你就去猜是什么意思吧!

  第二处谬误是,第一段文字说得很清楚,钟书仍然兼管研究生,而“谷歌翻译”却把钟书翻成了研究生。

  第三处谬误是关于“毛选翻译委员会”,毛泽东主席的“东”字被省掉了。

  第四处谬误是,“永煐”这个名字被译成了“Yongjian”。

  第五处谬误是,“客去后”被翻成了“客要走”。

  第六处谬误是,最后一句话完全不知所云。

  好吧,这六处错误已经能让“谷歌翻译”够喝一壶的了,不过我们完全可以不用在意这些错误。现在,我将集中探讨一个令人费解的词组——最后一段话中由5个单词组成的、用引号标注的词组(“南书房行走”)。如果逐字翻译,这个词组可以被译作“south book room go walk”,但这种大杂烩显然是难以理解的,尤其是考虑到文中的语境,它肯定是一个名词。“谷歌翻译”给出的结果是“South study walking”,但仍然词不达意。

  我得承认,刚开始我也不知道这个中文词组是什么意思。尽管从字面上看它的意思似乎是,在某栋建筑的南边学习的时候移动自己的脚步。我知道,这种理解肯定是错的,不符合语境。为了翻译它,我不得不去了解我并不太熟悉的中国文化。我该寻求谁的帮助呢?谷歌啊!(但不是“谷歌翻译”。)我将这几个中文单词连同引号输入谷歌搜索框,然后让引擎自己去搜索。很快,一堆中文网页跳了出来,我痛苦地在前两个网页呈现的中文语句中搜寻,想要搞明白这个词组究竟是什么意思。

  我发现,这个词要追溯到清朝(1644-1911),专指辅助皇帝的知识分子,他们的责任是帮助皇帝(在皇宫的南书房)起草漂亮的官方文件。“行走”这个词实际上意指“辅助”。因此,根据谷歌搜索提供的信息,我把这个词组翻译成了“South Study special aide”。

  显然,“谷歌翻译”没能像我一样好好利用谷歌搜索,这真是太糟糕不过了,不是吗?尽管“谷歌翻译”能在瞬间翻出这个词组,但它不能理解网页里的中文内容。我把我查看的中文网页信息输入“谷歌翻译”,它很快就呈现了如下结果:

  “South study walking” is not an official position, before the Qing era this is just a “messenger,” generally by the then imperial intellectuals Hanlin to serve as. South study in the Hanlin officials in the “select chencai only goods and excellent” into the value, called “South study walking.” Because of the close to the emperor, the emperor’s decision to have a certain influence. Yongzheng later set up “military aircraft,” the Minister of the military machine, full-time, although the study is still Hanlin into the value, but has no participation in government affairs. Scholars in the Qing Dynasty into the value of the South study proud. Many scholars and scholars in the early Qing Dynasty into the south through the study.

  这难道不是英文翻译吗?我们当然都知道,这段话是由英文单词组成的(至少绝大部分是如此),但这是否意味着它是一篇英语文章呢?在我看来,上面这段翻译不知所云,因此它不能算是英语文章,只是由英文单词拼凑而成的大杂烩——随机的词汇拼盘,毫无逻辑的乱炖。

  为了满足你的好奇心,我自己对这段文字做了翻译(花了我好几个小时):

  The nan-shufang-xingzou (“South Study special aide”) was not an official position, but in the early Qing Dynasty it was a special role generally filled by whoever was the emperor’s current intellectual academician. The group of academicians who worked in the imperial palace’s south study would choose, among themselves, someone of great talent and good character to serve as ghostwriter for the emperor, and always to be at the emperor’s beck and call; that is why this role was called “South Study special aide.” The South Study aide, being so close to the emperor, was clearly in a position to influence the latter’s policy decisions. However, after Emperor Yongzheng established an official military ministry with a minister and various lower positions, the South Study aide, despite still being in the service of the emperor, no longer played a major role in governmental decision-making. Nonetheless, Qing Dynasty scholars were eager for the glory of working in the emperor’s south study, and during the early part of that dynasty, quite a few famous scholars served the emperor as South Study special aides.

  有些读者可能会怀疑,我是为了贬损“谷歌翻译”才有意选取那些难翻的文字的,而实际上“谷歌翻译”在大多数情况下的表现要好得多。这听起来有些道理,但事实上却并非如此。我从自己最近读的任意一本书中随机选取一段文字让它翻译,都会出现各种各样的错误,包括出现前面所提到的不知所云和无法理解的词组。

  当然,我承认,“谷歌翻译”有时会翻出一些看上去还不赖的句子(尽管与原文的意思仍有偏差或者完全误解了原文)。一两段翻得不错的完整语句可能会让人产生幻觉:“谷歌翻译”知道自己在做什么,能够理解它所“阅读”的文字。在这种情况下,它似乎给人留下了深刻的印象——它几乎能达到人类的水平!这样的赞美当然要归功于它的发明者和他们艰苦的工作。但与此同时,不要忘了,“谷歌翻译”是如何翻译前面那两段中文内容的,以及更前面的法语和德语段落的。要理解它为什么是失败的项目,人们需要牢记“伊莉莎效应”。百种语言引擎并没有在阅读任何东西——至少不是人类意义上“阅读”。它只是在机械处理文字。它所处理的符号与我们对这个世界的体验无关。它没有记忆可供提取,它能够快速处理文字,但这些文字对它而言没有图像、没有理解、没有意义。

  一个朋友问我,“谷歌翻译”的局限是否只是大数据资源不足造成的。他认为,如果你能大幅增加数据资源,比如,数百万或数十亿个数据库,最终它就能满足你所有的翻译需求,并且还能翻得很完美。但我不这么认为。拥有更多的“大数据”不会让你更接近于获得理解力,因为理解力涉及到拥有思想,缺乏思想是今天机器学习面临的最根本的问题。因此,我敢说,更大的数据库——甚至巨大的数据库——也不能解决这个问题。

  自然,这又引出了另一个问题:“谷歌翻译”对神经网络——一种试图模拟大脑的技术——的使用能让机器对语言产生理解吗?初看起来,似乎是可行的。但“谷歌翻译”对语言的处理仍然没能超越单词和词组这样的初级层面。在庞大数据库中,所有类型的统计数据都可以被用于神经网络,但这些统计数据只是用某些词语去联接另一些词语,而不是去联接思想。它没有试图创造一种内部结构,这种结构可以被视作思想、图像、记忆、体验。这些缥缈的心智内容仍然难以用算法来创生,因此,作为一种替代品,谷歌使用了成熟而具有效率的语词聚类统计算法。然而,这种技术的效果无法等同于思想,而思想是人们在阅读、理解、创造、修改、评判作品的过程中产生的。

  尽管我的看法是偏负面的,但人们对于“谷歌翻译”提供的服务还是给予了很高评价:它虽然不能很准确地把语言A翻成语言B,但的确可以在交流过程中发挥应急作用。只要被翻成语言B的文字大体上可以被理解,很多人就会对它十分满意。如果人们能明白一段外语的“基本意思”,他们就会觉得很开心。然而,在我看来,这显然不是“翻译”这个词的本义,但对有些人来说,“谷歌翻译”无疑是一个伟大的产品,它所做的工作就是翻译。好吧,我明白这些人的需求,也理解他们的那种开心。对他们而言,这的确是一种幸运。

  最近,我看到有技术狂热分子制作了柱状图,号称可以比较人工翻译和机器翻译的“质量”,这些图形表明,最新版本的翻译引擎已经很接近人工翻译水平了。但是,在我看来,这是一种对无法量化的事物进行量化的伪科学,或者,你也可以认为,是一群技术呆子试图将无形的、微妙的、艺术的事物进行量化。在我眼里,今天的“谷歌翻译”,其水准既有优秀的一面,也有搞笑的一面,而我是无法把我对它的感受进行量化的。回想一下前面提到的第一个翻译例子吧,里面涉及到“他的”和“她的”物品,没有理解能力的翻译机器几乎把这些物品都翻对了。尽管取得了这样小小的成功,但它还是没能理解整段话的意思。在这种情况下,人们应该如何量化它的工作质量呢?用看上去很科学的图表去证明翻译质量,不过是对科学方法的滥用而已。

  让我回到人类译者的悲观图景:他们很快将被机器超越和淘汰,逐渐变得无所事事,从而成为翻译质量的检验者和文字的修补者。这种看法充其量只适用于平庸的译者。一个严肃艺术家的工作绝不是从对低俗破烂作品的修修补补开始的,这些破烂不可能被打造成高雅艺术。艺术不是这个样子,而翻译无疑是一门艺术。

  在我多年的写作生涯中,我一直坚持认为,人类的大脑是一部机器——非常复杂的机器——我完全反对有些人的说法,说机器天然就不可能理解意义。甚至有一派哲学家声称,计算机绝不可能“理解语义”,因为它们是由“错误的材料”(硅)组成的。在我看来,这种观点是草率的胡说八道。我不想在这里深入讨论这个问题,但我也不想让读者对我留下这样一种印象:我相信计算机永远不可能拥有智力和理解力。如果我的这篇文章传递了这样一种意思,那是因为我提到的技术没有触及到人类智力的核心之处,前面所举的那些例子很清晰地表明了机器翻译的局限性。

  在我看来,没有根本的理由认为,原则上机器不会在某一天学会思考、创造、搞怪、怀旧、兴奋、恐惧、高兴、沉默、期盼。进而言之,机器可以真正学会在不同语言之间进行翻译。没有根本的理由认为,机器不会在某一天成功翻译笑话、双关语、剧本、小说、诗歌,当然,还有像本文这样的文章。但是,所有这一切只有在机器拥有了类似人类的思想、情绪和体验的基础上才能实现,而这绝非近在咫尺的事情。实际上,我相信我们还有相当长的路要走。至少,这是一个一辈子对人类心智之深邃充满敬畏的人所热切希望的。

  如果有一天翻译机器能翻出用诗一般的英文写出的文艺小说,并准确呈现出其中的押韵、赋格、节律、智慧、悲伤和声韵,那么我知道,是时候摘下我的帽子,向它致敬了。

  [1] Pi在这里是π的谐音,代表略大于3的数字。

  [2] 比如,汽车通常被认为是属于男性的物品,因此,法语就只会说“他的汽车”,而不会说“她的汽车”。毛巾通常被认为是属于女性的物品,因此,法语就只会说“她的毛巾”,而不会说“他的毛巾”。

  [3] hers本来意指“她的书房”,但它没把这个意思翻出来,而是翻成了“他们”。

  [4] 中文意思与原文翻成的中文大致相同。

  [5] 这句法文是谷歌翻译的,作者认为它是词不达意的。

  科普神人侯世达

  美国著名认知科学家、比较文学家、翻译家,印第安纳大学认知科学和比较文学教授。(心智与实在)
 

  链接+

  巨头纷纷押注的智能翻译机,会是第一款成功的消费级AI硬件吗?

  到了今天,已经很少有人再提人工智能音箱了。使用率低、售价跳水、缺乏销售数据……我们不能武断地说智能音箱凉了,但的确不少所谓的AI企业的硬件梦碎了。

  相对于一些盲目涌入AI的公司,一些科技公司似乎找到了另外一条硬件路——翻译机。科大讯飞推出了晓译翻译机、谷歌推出了实时翻译耳机,搜狗也在最近推出了搜狗旅行翻译宝和搜狗速记翻译笔。

  开始呈现扎堆趋势的智能翻译机,是否会颠覆智能音箱成为下一个AI硬件浪潮?

  打败大魔王,AI消费级硬件当务之急是走出手机的阴影

  我们可以先从智能音箱的前车之鉴来看,智能翻译机最该避开哪些坑。

  除了产品质量良莠不齐等等弊端之外,智能音箱最大的问题是没有一项功能超出手机功能的子集。播放音乐、语音交互、传达命令,这些功能其实都能在手机上很好的完成,让智能音箱的使用率不断被压榨。

  其实不光是智能音箱,现在开始搭载移动AI芯片的手机简直是AI消费级硬件界的大魔王,让很多产品毫无用武之地。智能翻译机也是一样,翻译App已经能满足大部分的消费级翻译需求,翻译机一方面要赶上翻译App文字、图片多种媒介适用的特点,另一方面还要保证离线使用、操作简单和续航时间长,从而获得与手机之间的差异化优势。这很可能会成为让智能翻译机不会重蹈智能音箱覆辙的重要优势。

  三次迭代,什么才是智能翻译机的最终形态?

  其实这是一个最浅显道理,智能翻译机的产品迭代的方向也一直朝着替代和超越翻译App发展。

  第一代智能翻译机应该是以科大讯飞的晓译为代表,主打随说随译。这一代产品其实是最为尴尬的:虽然有强大的自然语言处理技术,可以较为准确的进行翻译工作,但很多功能还需连接手机借助网络才能使用。

  这类作为手机外置产品的翻译机和手机中的翻译App比起来几乎毫无竞争力,除了晓译之外,同类产品还有有道翻译蛋、全球译等等。虽然到后来第一代智能翻译机都增加了离线语言的种类,但比起App的拍照翻译等功能,还是差了一截。

  谷歌推出的实时翻译耳机Pixel Buds可以被看做第二代智能翻译机,这类翻译机常常以耳机的形态出现,有些需要WiFi/蓝牙与手机连接。同类产品还有IBM Watson和Lingmo推出的Translate One2One。实时翻译耳机相比单纯的翻译机有着更丰富的功能,除了用作翻译还可以当成蓝牙耳机使用,并且翻译速度更快,在双方都配置耳机时可以很好的进行拾音和语音生成,方便交流。但大多数翻译耳机还是作为手机外设存在,自身并不具备真正的翻译功能,甚至谷歌的Pixel Buds只能配适谷歌Pixel手机。

  而搜狗推出的搜狗旅行翻译宝,可以说是第三代智能翻译机了。除了提高翻译速度和准确率外,还加入了OCR技术,让用户可以进行实景翻译,并且摆脱了翻译APP对网络连接的依赖。

  硬件与软件的胶着战,第三代智能翻译机赢了吗?

  在短短的两三年之间,市面上的智能翻译机就已经进行了这么多次迭代,产品形态和功能也都发生了不小的变化。同样的,翻译App也在不断进行升级,从一开始的“词典”发展到可以整句翻译、语音翻译和今天的拍照翻译。你追我赶之中,这一次第三代智能翻译机走到翻译App前面了吗?

  首先看来,搜狗旅行翻译宝终于做到了摆脱对手机和网络的依赖,在离线状态下也可以完成翻译工作。做到这一步,就是拿下了最关键的赛点。在旅游场景中,国外、交通工具上都有可能没有网络信号,在商务场景中,有些场合也不适合使用手机。这些需要交流,却无法使用手机和网络的地方,为智能翻译机打开了不可替代的强需求市场,可以说离线功能是智能翻译机的根深立命之本。

  除了离线场景之外,智能翻译机一直没法超越的是翻译App多样化的翻译方式。借助手机自身多传感器的特性,翻译App可以对文字、图片、语音多种媒介进行翻译,实用性更高。现在加入了拍照翻译的第三代智能翻译机终于扳回一城,并且在语音翻译的拾音功能上,搜狗旅行翻译宝有着更专业的双麦克风阵列和降噪算法,利用语音增强技术放大原音,即使在噪音环境下也不会有误听误译的情况出现。

  从价格来看,搜狗这次推出了两款产品,一款是应用于旅游场景的旅行翻译宝,另一款是应用于会议、课堂场景的速记翻译笔,两款产品的售价分别是1498元和299元。好在智能翻译机的售价没有随着产品迭代水涨船高,这一售价还是相对友好的。除了单纯的售卖模式,很多旅行社也开始提供共享租赁服务,或许未来智能翻译机会通过这一契机走进人们的生活。

  高准入门槛和优质的参与者,或许才是智能翻译机的王牌

  智能翻译机不会成为智能音箱的另一个原因,就是这一行业较高的准入门槛。

  和智能音箱简单的接收语音信号、下达指令不同,智能翻译机的实时离线翻译对机器翻译、语音识别、图像识别、语音生成甚至知识图谱技术都有很高的要求。

  就拿在海外餐馆点菜使用搜狗旅行翻译宝这一简单的场景来说,就需要拍下照片进行图像识别,找到其中的文字并翻译成中文,和他人对话时,智能翻译机需要通过定向波束扫描规避噪音,准确拾音并进行翻译。在翻译过程中,还需要拥有相关领域的知识图谱,才能准确的捕捉到俚语、术语、双关语等等人类专属的文字游戏。而想要这一切都在离线状态下进行,还需要强大的压缩技术,让模型得以存储终端中。

  所以在智能翻译机领域很难见到类似智能音箱的盛况:各种相关的和不相关的企业都来赶风口。目前智能翻译机领域的参与者,基本有三类。

  第一类是专业从事AI技术开发的企业,如科大讯飞和IBM Waston。第二类是拥有巨大用户规模,通过自身产品,像输入法、搜索等业务在知识图谱和语音技术上建起壁垒的企业,比如搜狗、谷歌。第三类,是一些垂直研发翻译产品的企业,像有道云、全球译等等。较高的准入门槛对智能翻译机形成了一种保护,竞争对手都各有优势,不至于出品太过劣质的产品让市场对整个品类失望。

  智能音箱留给我们最大的反思大概就是,宁愿在泥土中多蛰伏一会儿,也不要开出畸形的花。如今智能翻译机已经开始破土而出,愿它能结下AI消费硬件的第一枚果实。(搜狐)

分享到:
责任编辑:admin

网友评论