第二节 英语教学词元研究思路
1. 主要借鉴材料
教学词元在语言教学或日常交流中使用频繁,往往充当释义词汇的角色,是学习新词,消除交际障碍的重要手段。现代英语教学词元的研究主要可以借鉴英语核心词汇(core vocabulary)的研究及各类高频词表。“核心词汇”(core vocabulary)一般是指最简单,最基本的词汇(汪榕培,2000:2)。它们是在各种文体中频繁使用的、在各种语言中普遍存在的、语义概括、搭配多样的基本词汇。对核心词汇的研究主要是出于对外交流和英语教学的需要。国外较早地开始了核心词汇的研究,目前也已经有了一些可信度较高的词汇表,但由于各类词表的编撰年代、出发点并不一致,和本研究的教学词元的要求也不尽相同,存在种种缺陷,所以有必要对它们改造、整合,从而获得更为完整实用的元语言词表。
(1)核心词表
① Ogden的基础英语(Basic English)
基础英语(Basic English)全名是英美国际科技商务英语(British-American-Scientific- International-Commercial English),取其首位字母,简称Basic English,顾名思义,它是一套用于国际科技商务交流的英语体系,其创立者为Charles K. Ogden,主要合作者是I. A. Richards。
产生背景
一直以来很多有识之士都希望找到一种人类共同的语言,从而克服国家与国家间的交流障碍。随着各国政治、经济、科学文化以及交通的不断发展,国家间的交往日益频繁,语言分岐在国际生活中日益突出。在1887年由波兰医生柴门霍夫(Zamenhof)创立的世界语(Esperanto)正是适应了这样的需求。他希望通过这种人工语言的推广消除民族间的误解和隔阂,促使世界各民族平等和睦。世界语产生后迅速在欧洲传播,并向世界各地推广。在这样轰轰烈烈的热潮中,也有学者对此颇不以为然。Ogden和Richards就是如此。他们认为,世界语只是一种人造的符号和规则,没有任何母语作为依托,其本身的发展必然受到限制,缺乏后继性。而且这对全世界各个民族来说都是一种全新的语言,学习这种语言必然耗费大量人力物力。他们希望建立一套以英语为基础、但又比英语简单的国际辅助语言。这种语言不是人工符号,完全采用英语的句法和构词规则,但比自然英语易学易懂,英语国家的人都能理解,于是就有了“基础英语”。
基础英语的设计理念与Ogden和Richards的语言观也是一脉相承。在他们的语义三角中,能指和所指之间用虚线连接。因为他们认为文字是任意的符号,和意义不存在内在联系。意义就像变色龙一样随着环境而改变颜色,因此在瑞恰兹看来,词汇的意义取决于上下文,语境是意义的关键。由于意义的不确定性,在交谈过程中,两人可能用同样的词表示不同的意义。例如:当你说“狗”,一方可能指走路摇摇晃晃,喜欢小孩的温柔宠物。另一方可能指一种食肉的的犬科动物,爱咬人,尤其——“喜欢”小孩。如果双方没有意识到这点,交谈就可能出现障碍。Richards认为语境决定意义的原则适用于任何词汇,包括:描述性的科学词汇,情感类的诗歌词汇,以及大部分介于两者之间的词汇。但他还认为各类词汇造成误解的可能性,其中情感类词汇是最容易引起误解的。例如“爱”可以是情人之爱、朋友之爱、母子之爱、兄妹之爱;精神之爱、肉体之爱等等很多种不同解释。交谈双方的生活经历差异越大,就越容易造成语义混乱。为了避免种种误解,瑞恰兹提出了一些解决办法,其中之一就是“基础英语”。他认为,基础英语摒弃了那些容易造成误解的文学类词汇、体现特殊风格的词汇和情感类词汇,保留了指称类词汇和普通文本词汇,是个简单易学,通俗易懂的语言系统,用这样一个简明的系统进行交流,就可大大减少语言的歧义和不确定性,减少误解。
Ogden&Richards(1923:11)的语义三角
词表构成
首先,Ogden和Richards确定了基础英语的三个原则。(1)基础英语必须是多用途的英语,可用于商业、贸易、技术培训、新闻、科学、政治、人类其他各种场合的简单交流。(2)它必须和目前的英语用法一致。对于那些想继续学习掌握完整英语的人来说,基础英语不存在冲突的地方,不会阻碍他们的进步。(3)它的词汇量有限,而且尽可能简单,易于理解,句法规则整齐。这三个原则说明基础英语是一个适用于多种语域的、自然的、受限语言系统。
基础英语的核心部分是一个850词的词汇表。之所以是850词,而不是更多或更少,是考虑到了学习者的接受能力和使用需要。研究者声称一般的学习者每小时可以记住30个单词,假设一天三小时,10天左右可以记住所有单词,另外再加两小时记规则、作句型练习。这样,从理论上讲,两天可以掌握;从实践上讲需一周,对东方学习者来说也只需一个月。所以要使这一系统具有操作可行性,词汇量不可以很大;但如果要实现第一阶段的学习目的,也不可以太少,编者试图在两者间找到平衡。
基础英语包括600个名词(其中有200个可以图示),150个形容词(包括50对正反义词),100个结构词,包括动词,代词,和其他。Ogden认为这些词通过组合搭配,可以实现20 000词的功用。如,disembark,可以表达为:get off a ship;shape由普通词form代替,difficult由hard代替。
需要指出的是,Ogden认为以往的英语教学之所以不成功原因之一是英语动词的变化形式太复杂,于是他在词表中只列了18个动词,其中包括助动词may和 will,此外还有come,get,give,go,keep,let,make,put,seem,take,be,do,have,say,see和send,这些都是组合能力很强的词。Odgen声称,把这些动词和介词如:in,over,through,等组合,如insert可由put in代替,这样可组成2,3千复杂的意思。这一数据的可靠性还有待证实,但这些动词的核心地位是毫无疑问的。而且编者还将一些既是名词,又是动词的词汇统统当作名词使用,因为绝大多数动词的意义可以通过与其他词的组合来实现,如:动词increase可由on the increase 或make an increase等代替。此外他们还用这850词改写了一系列文章,如:林肯、邱吉尔的演说,《圣经》等等,使原本深奥的语言变得浅显易懂。
当然这850词只是英语学习的第一步,Odgen也为下一步的学习指明了方向。紧接着学习者需要掌握的是150个国际词汇(international words),其中包括各国常见的物品、机构名称,如:cigarette(香烟),club(俱乐部),bank(银行),bar(酒吧),whisky(威士忌),university(大学)等,还包括学科、科技类词汇,如:biology(生物),chemistry(化学),geography(地理),aluminum(铝),lava(熔岩),此外还包括星期、月份、日期、数字、度量衡单位,以及一些拟声词。另外,Odgen还列出了接下来需要掌握的1 000词,这样加上原来的850基本词和150国际词汇,总共为2 000词。设计者认为,如果学习者全部掌握了这2 000词,就能够毫不困难地实现英语交流。
存在问题
基础英语在最初的十年间在国际上取得了广泛的发展,很快吸引了世界上许多学者和管理者的注意。从1930年发表《基础英语:规则和语法综述》以来,Ogden及其合作者在大约十年的时间内就先后出版了150多种用关基础英语的教材、参考书,词典或读物。当时他们还在多个国家,如中国,日本,新加坡,印度,丹麦等建立相关机构,专门从事基础英语的教学和推广。值得一提的是,Richards本人也曾在1929年和1937年两次来北京,在清华大学作为客座教授,编写教材,推广基础英语。该组织一度还得到邱吉尔的关注,从而获得英国政府的财政资助。但是最终基础英语并没有得到广泛传播,究其原因,战争是一个因素,其自身的缺陷同样也不可忽视。
Ogden编写词表的初衷是使词汇满足基本表达的需要,所以更多考虑的是词汇内容和意义的完整性,而非词频,所以在其850词中有些词在《英国国家语料库》的词频表中甚至排在4 000之外,如:apparatus(器械),brass(铜),digestion(消化),disgust(令人厌恶),harbor(海港),harmony(融洽)等等,后1 000词中的低频词则更常见,其中以具体的科技类词汇居多,如buoyancy(浮力),cusp(尖端),contour(海岸线)等等。另外,许多非常常见的词如:age,ago,call,each等却被归在850词之外,2 000词之内,甚至有些词,如:sit,nice,thank,eat都在2 000词之外。所以整个词表看来难度不一,常见词和生僻词夹杂在一起,存在种种漏洞。作者试图保持词表的完整性,所以将各种科技类词汇也罗列其中,但这样就牺牲了它的实用性。对于非专业人士来讲,这些词汇没有任何价值;即使是专业人士,也只是具体某个学科的词对他们有用,而真正涉及到该专业的具体词汇时,词表所给出的又显得不够精细。所以更好的做法应该是将科技类词汇和日常词汇分别列表,而且专业词汇也应按学科分门别类,让学习者在掌握常用词汇的基础上根据个人需要再进一步强化专业词汇,而编者将所有的科技词汇归纳在一张表里是不够合理的。
此外,就算学习者根据这850词的词表顺利表达自己的意思,并为对方所理解,这也仅仅解决了其自身说或写的问题,这并不能保证他能听懂或看懂对方的表达,词汇量显然是导致这一结果的最直接的原因。因为英语国家的人不清楚哪个词属于基础英语范畴,这样母语为英语的人也必须对该体系有所了解,迎合其表达规律。这是很不现实的,因为他们毕竟不是语言学家,他们不可能知道表达“种类”时只能用sort,不能用kind,“still”只有“仍然”的意思,没有“安静”的意思,表示“忍受”时只能用put up with,不能用tolerate,等等。
最后,虽然只是850词,但要完全掌握绝非作者想象的那么简单。就动词而言,这十几个动词可以说是最复杂的,它们的用法繁多,和介词的种种搭配连母语使用者都感到迷惑,因为很多词组的意义不是单凭词汇表面的组合就能猜出来的。这也一直是英语词汇学习的难点,同一动词和不同介词搭配产生的各种意义极易混淆,对记忆是项巨大的挑战。所以要让初学者掌握put about,put across,put away,put on,put through,put forward,put up,put up with 等等多种搭配的意思是不现实的,从记忆角度讲也是不科学的,因为记住put up with并不一定比记住tolerate或endure更简单。
尽管基础英语现在已经很少有人问津,但它在当时的确是一种全新的教学理念,对推广英语及其文化起到了不可磨灭的作用。它的较早地提出了词汇控制,科学分级,利用有限的词汇编写教材等思想,这对后来的语言教学产生了深远的影响。此外,Ogden在1932年就将基础英语850词用于词典编纂,他于同年出版的《基础英语词典》(The Basic Dictionary)收录常用词20 000,完全用这850词释义(程曾厚,1987:4)。这也开创了利用受限词汇进行词典释义的先河。
② West的《通用词表》
《通用词表》是West在1953年出版的,是词表研究的经典之作,至今仍被频频提及。
产生背景
在20世纪上半叶,一些学者就开始进行一些基于语料库的词汇研究,统计词频,为英语教学提供科学的依据。《通用词表》正是在这样的背景之下产生的,它借鉴了语料库语言学家们的研究成果。
1921年Thorndike为了编写出更好的教材,建立了一个450万词的语料库,开创了词频统计的先例。该语料库有3/4的语料选自《圣经》和19世纪的经典作品,其他的语料选自信件、报纸以及学生的阅读材料。在这个语料库的基础上,Thorndike统计出了其中每个词的相对频率。Thorndike的词频表成为全世界范围内英语教材编写的基础。到了30年代,Thorndike与Lorge合作,将其语料库扩展至1 800万词。语料来源更加广泛,其中包括学校课本、儿童经典读物、英语诗歌等各种书面语。基于这个语料库,1944年Thorndike和Lorge,出版了The Teacher's Word book of 30 000 Words。该书成为编写阅读教材必不可少的参考。1949年Lorge又出版了该词频表的修订本,描写了在450万词的文本中500个最常用词汇的不同语义用法的频率,这对后来West的研究影响巨大。
West本人也非常关注语料库的研究,在他的倡议下,1934和1935年召开了两次国际会议,讨论以语料库为基础的词表对英语作为外语的教学中的作用。提出了首先学习高频词汇,以避免记忆负荷过重与混淆的原则。后来West利用Lorge在1949年的统计结果,在1953年出版了General service list of English Words。这是一套包含2 000多词汇的词表,专门为英语学习者编制。这里的词都是指词目(headword),即词的屈折或派生形式都归入该词目,所以如果要将词目的变化形式都计算在内则远远超过了2 000。该词表多年来都有着广泛的影响,是编写各类分级读物和材料的基础,在二语研究中被广泛使用,在相关文章中也经常被引用。出版时该词表是本字典状的小书,每个中心词按字母顺序排列,给出简单的解释和例句,并标出该词在500万词的书面语语料库中出现的词频。此外,作者还给每个词义都标出了百分比,代表该词出现时使用该词义的比例。中心词以大写粗体的形式列出,派生词在中心词下面,以小写粗体列出,并给出词频。
West在选择词汇时词频是一个重要的考虑因素,但并非惟一的因素。因为他编写词表的初衷是用于英语教学,力求使学生获得最有用的词汇。这就首先要求词汇具有通用性(universality——即在所有英语国家通用)和适用性(utility——适用于尽可能多的场合)。通用性和适用性这两个标准可以保证教给学习者的是标准英语,这种英语为英语国家各阶层广泛接受,不具太多的地方色彩或领域限制。就这两点而言,一般的高频词都能满足要求。此外,词汇的意义还必须具有系统性和完整性,以满足交流的需求。这第二点就不一定是高频词所能胜任的,因为2 000以内的高频词难免会存在语义空缺或语义重复。
词表构成
事实上《通用词表》许多词汇并非频率最高。将该词表的2 284个词与英国国家语料库前2 500词的词频表相比较,重合部分只占到70%(之所以将词频表的范围扩展到2 500之内是因为统计词频时同一单词的不同词性会分别给出不同的词频,如about用作介词时排在第69位,用作副词时位于179位,不同词性about就被记为两个词,而在West的词表中只作一词计算,所以有必要适当扩大词频表的范围)。《通用词表》有将近700词在2 500词频表之外。在这700词中,名词有360多个,超过了一半。还有一部分词汇既可作名词也可作动词,如:regret(遗憾),wrap(包装),praise(表扬),pump(抽、吸)等,这类词大约有80多个。如果把这类词也归入名词,则增加的名词总共将近450个,约占总数的三分之二,而整个通用词表中名词约为二分之一。在360多个名词中,动物、物品名称、工具、身体部位、材料、称谓等具体名词有280多个,占绝大多数,如:elephant(大象),sheep(羊),ribbon(缎带),arrow(箭),cap(帽子),clock(钟),stove(炉子),axe(斧子),stomach(胃),flour(面粉),nephew(侄子)等,这些词汇并非出现频率最高,但人们不管在英语国家还是非英语国家的日常生活中都会碰到,如果不掌握必然造成交流障碍,因为这些名词很难用其他同义词代替或用更简单的词解释清楚。补充的名词大多具有跨文化的普遍性,但也有个别词汇是西方国家特有,如:heaven(天堂),priest(牧师)与其宗教相关,fork(叉子)与其餐饮相关,而gallon(加仑),pint(品脱)则是英语国家特有的计量单位。总的说来特有的名词为数不多,不会超过10个。除了这些具体名词,《通用词表》还增加了近80个抽象名词,如:hesitation(犹豫),imitation(模仿),courage(勇气),shame(羞耻),mercy(仁慈),pity(同情),prejudice(偏见)等。
除了名词,增加的另一大类就是动词。除了上文提到的既作动词又作名词的80多个词汇外,词表还包括90多个单纯的动词,两类动词加起来共170多,占四分之一,和整个词表中动词的比例一致。还有100多个主要是形容词。
补充的700词中没有副词。在整个词表中很少有以后缀-ly结尾的副词,其原因是由于这样的副词都可通过形容词增加词缀获得。学生如果掌握了形容词,则同样词根的副词便不再是难事。所以即使有些副词,如:usually,suddenly比形容词的词频更高,编者仍然保留了其形容词形式。剩下的副词为数不多,但词频都非常高,没有一个在2 500之外的,如:ever,never,where,sometime等等,这些词汇都在第一批被悉数收入。这样,副词中最重要的部分已经收进词表,其他部分可以根据词形变化知识自行判断,所以也没必要另行增加。
《通用词表》在吸收非高频词的同时必然抛弃一部分高频词。没被收录的2 500之内高频词主要有三类。第一类,这些词其他更常见的词存在语义重复,也就是说,它们都可以用一些简单词或词的组合来代替,这样更基本的词就代替了它们。这种情况占了绝大部分。如:interpret可用translate或explain代替;contract可由agreement代替;curriculum可由course代替;peak作名词可以解释为the top of a mountain,引申为the point of greatest success,作动词则可解释为reach the highest point等等。第二种为为合成词,即由两个或以上的单词组合而成的词汇,这些合成词的组成部分一般在词表中已经分别出现过,读者一般能够猜出该组合的意思,所以可以不在词汇表中列出,如:football,lifespan,background,birthday等。第三种专业词汇,涉及到金融,法律,政治,科技等,如:recession,inflation,legislation,plaintiff,statutory,communist,parliament,module等。
存在问题
当然,该词表并非十全十美。首先由于年代久远,一些近几十年出现的事物,如:television(电视),computer(电脑)等都不可能被收录在内。其次,尽管编者增加了大量的名词,但语义空缺仍无法避免。一些常见的物品名称或范畴,如:potato(土豆),rose(玫瑰),magazine(杂志),trousers(裤子),vegetable(蔬菜),adult(成人),sex(性)等不知何故没被收录。另外,为了保证语义覆盖面的完整性,避免语义重复,编者舍弃了一些重要的高频词,仅仅因为词表中已经有了它们被词表中其他词代替。例如,编者收录了work,放弃了job。两者作为名词意思基本一致,只是前者不可数,后者可数,前者的用法更多一些,从这几点讲选择work完全合乎情理。但是job也是个非常重要的词汇,在一亿词的英语国家语料库中词频排在第290位,在英语表达中出现极为频繁。对英语学习者来说,如果连job都没掌握,就要他学会该词汇表中类似beak(喙),conscience(良心)等词汇,似乎有点不切实际。但是,同一词表中作者也并没有完全抛弃所有同义词。如:begin和start两词均被保留,这有可能是因为两者词频不相上下,前者排214位,后者225位。但是一份以教学为目标的核心词汇表不仅要考虑到学生在表达时的需要,也要考虑其在阅读时的需要。语料库研究表明,词频最高的1 000词大约构成了一般文本的72%(Francis & Kucera,1982)。所以词频在1 000以内的常用词都应该被视作核心词尽量保留。类似这样遗漏的词有:achieve(完成),area(领域),final(最后),goal(目标),means(手段),prime(主要的),remove(除去),require(要求),research(研究),role(角色),style(风格),task(任务),team(队伍),theory(理论)等。它们都位于1 000以内,而且释义、用法丰富,被排除在外实在不太合理。
但是,不管怎么说,该词表是将词汇频率用于英语教学的创造性总结,成为了课程设置和教材选择的必要参照,到今天仍然常常被引用。如,Nation等人在此基础上编写了一份作《大学词表》(University Word List)(Xue & Nation,1984)。这是个包含800多词(headword)的词表,为已经掌握了《通用词表》学生的进入英语国家的大学学习而准备的。Nation本人在做的1 000、2 000的词汇量测试中所采用的词表就是《通用词表》。这些无不说明其影响力巨大。
(2)高频词表
《通用词表》是第一个依据语料库的统计数据编撰的教学词表。当时语料库规模有限,选材也略显陈旧,以书面语和文学语言为主,研究手段也还只停留在卡片制作和人工检索的阶段。将大量语料作电脑化处理,即用电脑进行注释加工,电脑解码以及电脑检索、取样和统计分析等则是近二、三十年的事。电脑语料库的容量大,资料真实,信息提取快速准确,它可以从多方面、多层次描述语言并且验证各种语言理论和假设。本世纪60-70年代最先建立的Brown Corpus和LOB Corpus分别汇集100万词次的英国和美国书面英语;80年代推出的London-Lund Corpus of Spoken English(LLC)则是第一部汇集了50万词次的英语口语语料库;90年代集有1亿词次的英国国家语料库(British National Corpus,以下简称BNC)也已问世。目前正在建设中的International Corpus of English(ICE)汇集全球20个国家和地区的英语语料,每个国家和地区的分语库均备有书面和口头语各50万词次,建成之后,这个国际英语语库将可用来进行跨国界、跨地域、跨文化、跨语域的英语对比分析。这一切都为语言学,尤其是英语语言的研究提供了无穷无尽的资料源泉,也为教学词元研究提供了直接的参考。
本研究重点参考三种以语料库为基础的词表,分别为:《英国国家语料库高频词表》,《CHILDES高频词表》和《麦克米伦三星级词汇表》。英国国家语料库(BNC)由英国牛津大学出版杜、朗文出版公司、钱伯斯一哈洛普出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机研究中心以及大英图书馆等联合开发建立的大型语料库,1995年由Lou Burnard和G. Leech等人主持建立。该语料库语料来源广泛,书面语与口语并用,BNC(2.0)光盘版词次超过一亿,其中书面语9千万词,口语1千万词。该语料库包括各个年龄段、各个社会阶层的语言,覆盖英国语言的方方面面,是个大型通用的语料库。该语科库的创作性文本(Imaginative Texts)取自1960-1991年的文本;信息性文本(Informative Texts)取自1975-1994年的文本;口语语料取样多为1990-1994年的,属于共时语料库,反映了当代英语的使用现状。BNC书面语语料库包含3 209个文本,每个样本的大小不超过4万词次,选自书本、报刊、广告、传单、信函、随笔和口述性文本,涉及的领域包括应用科学、艺术、信仰和思想、商业、金融、娱乐、自然科学、社会科学、国际事务等。BNC的口语文本由互为补充的两部分组成:人口抽样部分(demographic sampling)和话语类型抽样部分(sampling by discourse type)(Leech 1993:13;Rundell 1995:30)。在编制人口抽样部分时,广泛挑选了来自不同年龄、职业、地域的l5名自愿人员,把微型录音机藏在这些人身上,让录音机一连几天开着,以此获得这些人在不同情景(如在家中、商店、工作场所、酒店等)的日常交谈录音。话语类型抽样部分收集了不同语境中的材料录音,主要包括:演讲、业务会议、电视直播节目、大学研讨会、广播录音、课堂录音等。口语语料库独白文本(monologue)的取样有200 000词,会话文本(dialogue)的取样约为300 000个词(李赛红,2002)。由于口语取样的独特性,决定了每个文本的词数亦不尽相同。综上所述,BNC的规模、选材、设计都说明了它的权威性。本研究选用该语料库的词频表作为教学词元删选的重要参考。
《CHILDES高频词表》是以世界上最大的儿童语言语料库CHILDES为基础,统计出的儿童英语高频词。该语料库名称为儿童语言数据交流系统(Child Language Data Exchange System),简称CHILDES(MacWhinney,1991)。它是在美国麦克阿瑟基金会资助下,由MacWhinney和Snow于1984年开始筹建,经过近20年的建设,已成为目前世界上最大的儿童口语语料库(温志军,胡瑰玲,2001:374-377)。到目前为止,该语料库已收集了包括英语、汉语、日语、法语、德语、意大利语等在内的25种语言。这些语料主要是由儿童心理学家收集捐赠,包括儿童和父母的对话、儿童平时的自言自语,儿童和实验者的谈话,儿童讲述的故事等等。本研究选取了一份包含约3 000词的高频词词表,该词表是对语料库中260万儿童英语语料的统计结果,频次在25次以上,其中涉及到的儿童年龄跨度在1岁1个月到10岁之间。因为儿童在交流中首先掌握的词汇一般都是日常生活中必不可少的词汇,所以对于英语教学词元研究具有重要参考价值。但同时必须考虑到,毕竟儿童的生活经历有限,他们的谈话不可能涉及社会的方方面面,而且该词表是以口语为基础,所以在语义场的完整性方面必然存在缺陷,因此,该词表也不能作为惟一的参考。此外,由于儿童语言中包含许多缩写和不规范的词汇形式,所以必须先对其进行修改,使之规范化。
《麦克米伦核心词汇表》是《麦克米伦高阶英语词典》中标注的三星级词汇,共2 000多个。该词典是以《世界英语语料库》(World English Corpus)为基础编写而成的,该语料库以美国英语、英国英语为主,也包含世界其他国家使用的英语。语料来自报纸、杂志、书刊、邮件、电视、广播,文本包括学术论文、会议发言、小说、法律文书、商务报告、新闻报导、学校教材等等,规模在2亿词次,其中书面语和口语的比例是9比1。该词典在2002年才编写完成出版,因而可以说是当前最新的一本英语词典,荣获英国2002年度英语语言教学出版物奖。它所有的例句和搭配都来自语料库,而且该词典还根据语料库中词汇的出现频率用红色标注了7 500个核心词汇,分为三个等级,使用最频繁的为三星级,二星级的次之,使用不是很频繁、但也需要掌握的是一星级。其中三星级词汇是本研究的参考重点,二星级词汇也可提供一定的参照。
总的说来,高频词表属于英语中最常用的词汇,其重要性无用置疑。但因为本研究涉及的教学词元对词汇不仅有量的要求,而且还有质的制约。即教学词元系统要保证覆盖各个相关语义域,尽管有些话题不会被经常提及,但从语义研究的角度来看,还是有必要将与该主题相关的最常用的词汇包含进去。所以从语义域覆盖的完整性而言,高频词表必然存在欠缺。
英语教学词元研究主要建立在以往核心词汇研究的基础之上。本研究主要参考了三类词表,分别为《基础英语词汇表》、《通用词表》和各类高频词表。“基础英语”主要是为了将英语简化为国际辅助语言。现在看来这种尝试并不成功,因为母语为英语的使用者不愿意接受经过改造的语言,觉得那是对英语精华的破坏,基础英语失去了语言本身的美感。虽然基础英语词表覆盖的语义场比较完整,但交流是双向的互动,使用者在交流时只能做到信息传递的有效,不能保证信息接收的通畅,所以,该词表抛弃多种高频词的做法是欠妥当的。为顺应英语基础教学而编纂的《通用词表》是以词频统计为基础,反映了现实中英语词汇的使用状况,但因为语料陈旧,该词表还存在值得改进的地方。近年来依据各类大型语料库统计获得的高频词表包含了英语中最常用的词汇,但是高频词表在词汇使用的频繁性和语义场的完整性的平衡问题上,还需进一步完善。
2. 教学词元研究总体目标和路线
(1)总体目标
教学词元的研究目的主要是为了选取2 000—3 000个基本词汇,作为英语教学基础阶段的择词依据。其满足的主要条件有两个,其一,所有词汇均属于常用词汇;其二,不存在语义空缺。第一个条件主要通过选取高频词来满足,第二个条件主要对照《朗文多功能分类词典》(简称《朗文分类》)中的各个义场及子义场进行增漏补缺,基本做到义场完整。
(2)研究路线
在收集完上述各类词表并分析其各自的背景、特征及问题的基础上进行以下研究:
第一步,提取共现词。本研究首先以《通用词表》、《麦克米伦三星级表》、《儿童语言常用词汇表》、《英国国家语料库高频词表》中进行比照,凡是在两个词表中出现过的词汇均保留,制成《共现词表》。
第二步,优化《共现词表》。将《共性词表》按照字母顺序排列,将删除部分同根词、口语词、异形词等,完成《共现词修正表》。
第三步,增补《共现词修正表》。将《共现词修正表》按照《朗文分类》的体系作语义分类,找出语义空缺,填补完整,从而获得规模在2 000—3 000之内的《教学词元表》(初稿)。
第四步,验证教学词元。分为释义验证和比照验证。释义验证又分为深度验证和广度验证。深度验证的具体操作为:从《朗文分类》中选取一类大的义场进行释义验证,凡是该义场中已经收入的词汇不再验证,没收入的词汇用已有的教学词元进行同义替代或语义解释。广度验证也采用同样的做法,只是验证对象不同,具体操作为:从《朗文分类》中每页的固定位置选取一个词汇,共计1 000多个,也同样进行释义验证。如出现空缺,则作必要增补。比照验证在下一个章节进行,具体操作为,将英语的教学词元与汉语的教学词元进行词项比照,增补可能出现的缺漏。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。