首页 理论教育 计算词典学

计算词典学

时间:2023-03-29 理论教育 版权反馈
【摘要】:6.1.1 计算词典学不知是默契还是竞争,在1995年这一年内,牛津大学出版社、剑桥大学出版社、朗文公司和柯林斯公司同时推出了自己的新产品,展示了计算词典学研究的新成就,使得计算机这种新型技术在编纂词典方面的优势初显峥嵘。Ooi提出计算词典学包括两个方面:一是利用计算机辅助实现词典编纂工作自动化的目标;二是利用现有商业性词典的机读版本,使其格式明晰化,从而服务于自然语言处理系统。

6.1.1 计算词典学

不知是默契还是竞争,在1995年这一年内,牛津大学出版社、剑桥大学出版社、朗文公司和柯林斯公司同时推出了自己的新产品,展示了计算词典学研究的新成就,使得计算机这种新型技术在编纂词典方面的优势初显峥嵘。所有这些词典新产品都是建立在搜集大量语料的基础上,利用索引程序从语料库中调出例句,再经编者清理加工、数据入库,从数据库生成文本词典样本,编者在样本基础上再划分义项、释义、加例证,进而生成并出版词典。

近三十年来,计算机技术被引入了词典编纂的各个环节从原始语料的搜集、整理,到义项划分、释义,从体例的统一、电子卡片的制作,到词典的存储、发行和再版,由于计算机存贮量大、速度快,可以大大提高词典编纂的功效,从而引发了词典编纂流程翻天覆地的变化。

Hartmann认为,计算词典学指的是“与电子词典的设计、编制、使用和评估相关联的一系列复杂活动。它包括的范围甚广:从词典编纂主要阶段(例如,从语料库获取数据、计算机辅助歧义消解、在线文本处理、印刷技术的使用)的自动化到机读词典的应用(例如,应用于机器翻译和自然语言处理等领域),甚至包括全新的参考工具书(如CD-ROM,多媒体百科全书与多语术语数据库)的设计。”(Hartmann,2000:26)计算词典学研究的是各类电子词典的设计、编制以及评价等;它的最终目标是利用计算机辅助实现词典编纂自动化。

其他学者也持相似观点。Ooi提出计算词典学包括两个方面:一是利用计算机辅助实现词典编纂工作自动化的目标;二是利用现有商业性词典的机读版本,使其格式明晰化,从而服务于自然语言处理系统。Ooi的第二点思想是对计算词典学非常重要的补充,也就是说,除用于词典编纂自动化之外,计算词典学也用于改造、扩充纸质词典的电子版本,直接用于自然语言处理,以实现人机两用——把开发供机器使用的词库和开发供人使用的词库结合起来。(Ooi,1998;王小海,2003:12-13)

国外词典出版界从20世纪70年初开始就多次商讨如何将计算机用于词典编纂,主要议题包括如何用机读形式采集语料并生成定位索引(concordance)和索引;计算机辅助选择引例与排序;计算机辅助词条的编写与编辑;利用机读信息加速自然语言处理系统等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈