首页 理论教育 使用计算机化的语料库

使用计算机化的语料库

时间:2023-04-03 理论教育 版权反馈
【摘要】:12.2.5 使用计算机化的语料库语料库是大量收集的书面或口头文本构成的数据库,可以检索特定词的所有例证和所使用的语境。计算机化的语料库的使用给英语词典编纂带来了革命性的变化。学习词典在使用计算机语料库方面显得最为活跃,甚至已经成为一种惯例。

12.2.5 使用计算机化的语料库

语料库是大量收集的书面或口头文本构成的数据库,可以检索特定词的所有例证和所使用的语境。计算机化的语料库的使用给英语词典编纂带来了革命性的变化。学习词典在使用计算机语料库方面显得最为活跃,甚至已经成为一种惯例。例如:《朗文当代英语词典》中的75 000个例证就是以朗文引文语料库(Longman Citation Corpus)为基础编写而成的。整部《柯林斯合作英语词典》(1987)则是对英语库(The Bank of English)的大量英语文本进行全面检测之后编纂而成的。被收入该语料库的250万个词汇分别来自于书籍、杂志、报纸、小册子、传单、对话、录音和电视广播等。为了增强词典中语言的代表性,《朗文当代英语词典》(第3版)包含了从自然的非正式对话到文学和商业语言等各种文体形式,为此特意使用了拥有1亿词汇的《英国国家语料库》(British National Corpus),拥有3 000万词汇的《朗文兰开斯特语料库》(Longman Lancaster Corpus)和拥有500万词汇的《朗文学习者语料库》(Longman Learner's Corpus)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈