论机器翻译之崛起

译者: Pilvi | 发布: | 发布时间:2014-06-21,星期六 | 阅读:1,356
原文:Computer-aided translation: Johnson: Rise of the machine translators | The Economist
原作者:R.L.G. | DUBLIN

机器翻译越来越强,大有替代人工之势

以下文字可能使那些非常熟悉机器翻译(MT)的人士产生强烈共鸣。

把文字拖进鼎鼎大名的免费公开的翻译机器谷歌,区区数秒翻译结果便跃然眼前。你将情不自禁的夸赞:“强!“——这或许是共鸣之一。对双语人士而言,界面上的”等待正在翻译……“ 或许是共鸣之二。

跟所有机翻系统一样,谷歌翻译有很多错误,从细微小错到滑稽荒唐的大错,不一而足。

英特网在汉译英上相当糟糕(点击此处看示例)。不了解汉语的英语人士尚未意识到英特网在汉英翻译过程中所犯的错误有多么滑稽。举个例子,2011年占领华尔街抗议人士在机器翻译对话框中输入 “再也没有腐败“,指定翻成汉语。结果显示:”没有腐败。“

机 器翻译的困境数十年来始终困扰着智者,这就是为什么时至今日它与其说是“机器翻译”,不如说是具有二十世纪五十年代风格的模仿者。过去的机翻模型力图分解 原语的语法及含义,在目标语中进行重组。如此一来困难重重,所以该方法陷入一大堆棘手问题,想来也是不足为奇的。不过现在,处于“大数据”早期应用阶段的 (词组尚未形成风尚)机器翻译系统已普遍采用统计学的方式工作了。如果你在翻译模型中同时输入高质量人工翻译的标的语和原语文本,模型就会将A语言中的X 对应到B 语言中的Y。(在许多情况和不同语境下,X 通常更可能被翻译成 Z 而不是 Y)。你输入的文本越多,模型统计匹配的精确度就越高。这就是谷歌为什么在机翻方面表现不错,它除了拥有大量数据别无其他。

机器翻译在翻译 单个字词上表现甚佳,简直媲美在线词典。它也能很好的翻译约定俗成的词组,因为这些短语被翻译过多次,机器可以轻易的将它们提取出来,放到目标语中。意思 直白句子结构若是足够清晰,翻译结果便不会太坏。但是你一旦输入所有句子,你便会看到机翻的拙笨之处。而且整篇文章看起来竟感觉上下文毫无关联。

如果用谷歌翻译对同一文本进行多次翻译,先翻成德文再倒译回英文,各种错误及不当之处会叠加。如:

机 器翻译是很不错的单字,所有她所要做的,是作为一个在线词典翻译。这也是很好的通用率,因为这些块,翻译了很多次,所以很容易在目标语言表示。这不是坏 的,简单的句子结构清晰就够了,但是,一旦你开始的句子插入,你就可以看到在输出一些呆滞。和所有的歌词开始,其实看起来很杂乱。

若 是输入的东西是模型数据库里没有的,机器翻译就翻不出人们想要的结果,这是它格外突出的问题。一个名为“一知半解”(Hanzi Smatter) 的博客上有篇博文叫做《尽情飙速,死而无憾》,上面配了张图片,某骑车人在他自己身上纹了些汉字,这些汉字是用机器翻译得到的。唯一的问题是,他想纹的汉 字是“冲压打造金属的工具”,机器翻译反馈给他的结果是“死”。就这样,他把“死”永远纹到了自己身上。可能因为机器翻译模型里尚未出现“死而无憾”这种 说法吧。(同样,“无憾”也被翻译成了“免费”)。


可 能模型里有许多工业商业材料,在“工具”这个词上,机器没有选择其常见的含义——“尘埃落定,归入沉寂。”而选择了少见的“死”。要在身体上做全面纹身, 还是用你不了解的语言,依赖机器翻译结果可不是个好主意。不过也大可不必对机器翻译敬而远之,这种工具正在逐步提高,和人工后期编辑结合使用,效果最好。 自动化翻译用户协会(TAUS)本周在都柏林召开了一次会议,该组织意在为机器翻译用户提供资源分享平台,会议齐集发起人和用户共同探讨如何使用户之间更 多的互相数据资源。分享的人越多,受益的人也就越多,不过许多公司认为翻译模型当属于公司独有的知识资产。

企业之所以要享模型系统,原因在 专业领域里进行特定训练能让机器翻译质量快速提高。举例来说,从事工业生产的企业会在其模型里将“死”和“金属工具”等同起来,玩具商则可能倾向于“多维 数据集点”,宠物店则偏爱“入土下葬”。诸如此类的领域限制极大的提高了翻译的准确性。单独将翻译模型应用于其它领域效果反而不好。不过这个问题正在小而 化之,因为针对特定语言匹配和领域的翻译模型可以根据需要快速大幅度的定制。(只要有足够的训练文本即可。这就是为什么自动化翻译用户协会想要企业参与分 享的原因)。如此一来,机器翻译的角色就远不止“快速提供过得去的翻译”,或是旅游翻译了。戴尔电脑制造商韦恩·波兰德说,他的公司网站需要提供28种语 言,机器翻译加上后期人工编辑已经为其节省了40%的翻译时间。更重要的是,机器翻译省钱:自2011年以来,它已为戴尔公司节省了40%的成本。韦恩计 算得出戴尔在机器翻译上的投资回报可达900%——虽然是字面上的,但是戴尔追求的目标。那么,机器翻译某天是否会完全取代人类翻译呢?从长远来看,它是 否会取代人们学习外语的必要呢?本栏目将在下一期详细探讨。

 



 

版权声明

文章编辑: ( 点击名字查看他发布的更多文章 )
文章标题:论机器翻译之崛起
文章链接:http://ccdigs.com/57784.html

分类: IT观察, 新闻视线, 社会万象, 趣味科技.
标签: ,

发表评论