信息爆炸(information explosion)是当下时代的显性特征。据统计,人类在未来10年内处理的知识总量将超过人类之前2 500年知识积累之和,在人类曾经有过的所有科学家中,90%活在当代,且依然在工作;我们每天在因特网上传输的数据量比人类整个19世纪的全部信息量都要大,科技词汇总量已达3 000万,且在未来5年之内将会翻倍[2]。据有关部门统计,2005年世界翻译市场的产值达227亿美元,而中国翻译服务市场到2011年年底的产值已达人民币321亿元。目前,中国注册的翻译公司达4 000多个,全国翻译从业人员50多万[3]。
如此庞大的科技信息量若仅靠人工处理,或仅靠人工翻译去满足各语种人群,显然是不可能的,互联网、电子翻译工具必须而且已经开始肩负时代使命。我们知道,互联网有强大的信息超链接功能(hyperlink function),通过互联网(online)链接,可以获取任何相关语言资源来辅助翻译。比如,维基百科(Wikipedia)、谷歌搜索(Google)、百度翻译(Baidu)、互联网公共图书馆百科全书(Internet Public Library Encyclopedias)、韦伯斯特在线词典(Webster’s Online Dictionary)等。更有巴比伦(Babylon Pro)、灵格斯(Lingoes Translator)、有道(Yodao)、必应(Bing)、译星(Unitrans-star)、格微(Ge Soft)、赛迪(CCID)、译典通(Dr.eye Instant Translation)、译经(Transwhiz)、星际翻译(StarDict)、金山快译等各种各样翻译软件的问世,翻译生产力得到了前所未有的提高,翻译劳动力得到了前所未有的解放。要想查阅到更专业、更系统的语言信息数据,可使用相关网络链接渠道。例如:OPAC可以查询图书馆目录;Amazon可以进入网络虚拟书店;Britannica online可以查阅大英百科全书;PC Webopedia可链接专业百科全书;Merriam-Webster可享用普通词典和类属词典;Onelook可查询多语词典,即多语言词表、词典、数据库等;Termite可以查到多语言术语数据库;Eurodicautom可登录欧盟翻译服务部联网的术语数据库;ABC、Die Welt、Newsweek等可以浏览全球的电子报纸及杂志期刊文献等[4]。通过有效使用互联网电子工具,可检索全球语言资源信息数据,可谓览遍万维网,为翻译助强力。
另外,为减少互联网使用费用,或者为避免网络使用不便而耽误工作,也可利用CD-ROM这种只读光盘,进行脱机(offline)查阅,只要计算机安装有光盘驱动器,就可使用;而且CD-ROM还有超链接功能,可以链接光盘上的不同条目,进行分类或搜索。用这种方法获取语言翻译资源,既节俭又便捷。
随着互联网、电子翻译工具、翻译软件的普及使用,通过计算机辅助手段,对浩瀚的专业文献术语进行系统编目管理,开发计算机辅助术语管理系统(Teiminology Management System)软件(如MultiTerm),不仅有助于科技文献译者节省更多时间、精力、成本去查找和使用,也有助于推动专业文献术语的标准化进程,还有助于翻译资源的语料库(corpus)建设(目前语料库软件有WordSmith和Alta Vista等)。
在翻译工具的电子化与网络化进程中,国内相关技术行业及翻译界人士紧跟时代步伐,越发重视网络与机译技术的开发与利用,并探索符合职业化、产业化、社会化的翻译运作模式。比如,三个清华大学毕业生留美回国后,于2006年创办了译言网(yeeyan.org),宗旨是发现、翻译、分享中文之外的互联网精华。该网于2007年开始商业化运作,充分利用现代互联网技术的廉价、普及、便捷等强大优势,通过提供互联网社区平台无缝链接版权人和读者,来消除多语言信息传输的时间和空间障碍,将优质的外文网络资料译介给中文读者,并让更多的专业化人才在实现其个人价值的同时,获得优厚的报酬和社会认同机会。在译言网,用户可以自发提交原文、译文或进行阅读,站方编辑的任务是不断从中发现优质的原文源、具备一定实力的译者或阅读热点,并在获得原文版权后,组织社区译者速译,然后将高效的翻译成果转让给买家,通过收益分成来实现版权者、译者、站方的共赢。
像译言网这种通过建立高质量译文及翻译社区来吸引国内外一批高端译者群,并以版权引入为基础的社会化翻译与创作模式,已经是当下社会的发展趋势。互联网改变了传统翻译行业的版权引入运作流程以及翻译价值的分配方式,使传统模式下的从原文版权引进到翻译、印刷、发行等冗长、费时、费力的中间环节极度压缩,用网络技术实现了利益与效率的无缝对接。
另外,翻译记忆(Translation Memories,TM)软件是电子翻译工具的另一大突破,其功能是保存和重复使用质量高的人工译者的译文,目的是降低翻译成本,避免重复翻译。行业翻译内容往往重复率高,使用翻译记忆软件可以为企业、公司组建自己的专业资源翻译记忆库,以提高翻译效率和便捷使用。
对互联网翻译工具的使用,目前主要以人助机译(Humanassisted Machine Translation,HAMT)和机助人译(Machineaided Human Translation,MAHT)形式为主,二者也可合称为机助翻译(Computer-Assisted Translation,CAT)。相比人工翻译而言,机助翻译省时、省力、快捷,符合市场快速变化与需求。那么,全自动机器翻译到底是诱人的幻想与虚妄,还是切实可行的技术进化?机器翻译往往借助互联网检索、专业基础词典、翻译知识库、双语平行语料库、翻译记忆软件等储备资源,通过计算机程序员的编程,使软件可以通过输入原文的词法结构、知识系统、语义系统进行译语词法处理,进而输出译文;由于机器缺乏人的高智能分辨能力、想象力、审美能力、情感思维等特点,译出的东西就有可能不伦不类。我们看下面一个例子:
We do translation right.
它所衍生出来的意义不下20个,从语义逻辑来看,有的讲得通,有的讲不通。那么,到底哪个才是具体语境中的真实意义,机器能分辨吗?我们来看:
合乎语义逻辑的翻译有:
(1)我们做翻译正确。
(2)我们做翻译是对的。
(3)我们做的翻译是对的。
(4)我们就是做翻译的。
(5)我们有做翻译的权利。
(6)我们适合做翻译。
(7)我们可以做翻译,对吧?
(8)我们行使了翻译的权利。
(9)我们主张翻译权。
(10)我们还是做翻译好。
(11)我们做翻译有理。
(12)我们只做正确的翻译。
(13)我们公正地做翻译。
(14)我们只做对的翻译。
(15)我们的翻译才正确。
(16)我们做翻译很专业。
(17)只有我们可以做翻译。
(18)我们的翻译是正版的。
(19)我们只做正版的翻译。
(20)我们是翻译专家。
(21)我们才是真正做翻译的。
……
不合乎语义逻辑的翻译有:
(1)我们只做翻译的右半边。
(2)我们让翻译向右看齐。
(3)我们只做右边的翻译。
(4)我们肯定是翻译。
(5)我们要对翻译好。
(6)我们愿意翻译好。
(7)我们做得翻译很正。
(8)我们一定要把翻译打成右派!
(9)我们做的是右派的翻译。
(10)我们只做右撇子翻译。
(11)我们用右手翻译。
……
如果机器把“right”处理为“好的、对的、正确的、有权力的”,倒还讲得通(make sense),但机器尚不能分辨人与物的质的差别,这就导致机器翻译不可避免地会产生一些滑稽的译文。试想,翻译怎么可能被打成“右派”呢?说用“右手”翻译,或者翻译“右半边”都不合乎汉语规范。在合乎语义逻辑的翻译中,例(1)出自机器翻译的概率最大,但这句显然是有歧义(ambiguity)的,它可能产生例(2)和例(3)两层意思,而机器对这种语义逻辑的分辨能力是极其有限的。
另外还有句法结构层面的歧义,机器也是不能够有效分辨的。比如:
(1)他习惯吃面条。
(2)他习惯吃馆子。
(3)他习惯吃老本。
(4)他习惯吃软饭。
(5)他习惯吃亏。
以上例句的表层结构相同,但深层结构不同,而机器对这样的结构歧义却办法不多。
尽管机器是人工智能,在解决平行语料库、数据统计、信息处理等方面有优势,但由于高分辨率的机译也需要解决语法、语义、知识、智能、情感等人工译者可以解决的问题,在现阶段机器翻译对多义词、同义词、引申义、复杂句、文化词、歧义词(句)、惯用语、代词识别等问题仍难以有效解决,至少,全自动机器翻译(Full Automatic Machine Translation)在目前只能是个设想而已;况且,人的有些东西终究是机器无法取代的(如情感、思维、审美等),工具总是在人的监督与指导下为人服务的。因此,在大力发展翻译工具的同时,更要加强人工译者高素质的培养与培训,不能因为机器的部分功能而使人过早地产生懈怠与退化。
尽管如此,我们相信,人类文明的进化正是在不断地改造劳动工具的过程中实现的。当今互联网、信息时代的翻译行业尤其需要科技化与现代化,翻译工具的普遍使用势在必行。尽管现阶段的机器翻译有这样那样的不足,但随着翻译技术设备的不断更新和完善,相信翻译工具会迎来更高品质的时代。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。