第一节 汉语教学词元相关研究
“教学词元”这个概念在汉语界并没有被广泛使用,但这并不意味着汉语没有进行相关的研究。从本质而言,教学词元是指词汇中的最核心、最常用的部分,它们语义丰富,搭配多样,适用面广,与其他词汇相比,应该被语言学习者优先掌握。和英语一样,汉语的教学词元也具体表现为各类常用词表。汉语对教学词元的研究在理论上可以追溯到对基本词汇的探讨。
1. 对基本词汇的理论探讨
(1)基本词汇概念的提出
汉语学者对基本词汇的研究最早始于孙伏园在1947年发表的《基本词汇研究述要》一文(张能甫,1999)。作者认为,基本词汇是受过教育和没有受过教育的人都懂的词,受过教育的人能听、能说、能读、能写;没有受过教育的人虽然能听、能说,但是不能读、不能写。这说明基本词汇的一大特点是常用性。
但孙伏园的文章并没有引起广泛关注,学者们真正开始研究基本词汇是在50年代以后。一般认为,基本词汇这一概念是由斯大林1950年在《论语言学中的马克思主义》一文中提出的。在“语言的特征是什么”这个问题中,斯大林阐述了这样的观点:
语言中所有的词共同构成所谓语言的词汇,语言的词汇中的主要东西就是基本词汇,其中就包括成为它的基础的全部根词。基本词汇比语言的词汇少得多,可是它的生命却长久得多,它在千百年的长时期中生存着,并且为构成新词提供基础。(斯大林,1964:17)
据此学界将基本词汇的特征概括为:稳固性、能产性和全民性。
(2)基本词汇特征的争论
基本词汇的三个特征:稳固性、能产性和全民性,都有不确定性,如:稳固性的时间长度,能产性的构词数量和全面性的使用范围都缺乏具体的标准,而且在择词过程中任何一个特征都有可能违背,这就引发了汉语学界广泛的讨论,争论的焦点在于,是不是必须是同时满足三个条件的词汇才属于基本词汇?有没有只满足其中两个甚至一个条件的基本词汇?
对照词汇仔细推敲这三个特征,可以发现很多问题。首先是全民性和能产性存在矛盾之处。基本词汇必须是在日常生活中广泛使用的词汇,但是很多构词能力很强的单字词在实际使用中很少单独出现,如“父”、“母”、“耳”、“鼻”、“弟”、“所”总是和其他搭配成分同时使用。“耳”和“耳朵”,“眼”和“眼睛”哪个属于基本词汇?前者还是后者?在现代汉语中后者更具有全民性的特征,但前者构词能力更强。其次是稳定性的问题,究竟一个词汇存在多长时间才算稳定,这也似乎难下定论。有的词汇存在有几千年的历史,有的词汇只有几十年历史,是不是一定历史长久的才是基本词汇?如:“祭”、“祀”、“鼎”在两汉时代就属于基本词,一直沿用至今,一千多年的历史,完全具有稳定性的特征,但在今天看来还是无法纳入基本词汇范畴。还有一些词,如:“电视”、“电话”、“汽车”,在汉语中出现才几十年,但这并不妨碍它们成为基本词汇。看来稳定性这一特征也值得进一步推敲。最后,还有一个与能产性相关的问题,汉语中的虚词大都构词能力很弱,这是不是意味着要将这些使用频繁的副词、连词、助词、介词等等全部排除在基本词汇之外?
因为三个标准都有可能被推翻,于是学者们对这三个标准的取舍问题产生了不同的看法。葛本仪(1985,2001)、刘叔新(1990)就认为不必把能产性作为基本词汇的一个绝对标准,周荐(1987)索性说只需具有稳固性和全民常用性两个特点的就是基本词汇。但有学者认为能产性必不可少。如,符淮青先生(1985)在谈到“月”和“月亮”作为基本词汇的选择问题是指出,“宁可把‘月’看作属于基本词汇的词。因为‘月亮’的稳固性不如‘月’长,‘月亮’构词能力差。”为什么这样处理呢?“因为在三个标准中,构词能力是最重要的一个标准。有很强的构词能力,说明它是稳固的,因为构成那么多词要在长时期才能陆续完成。构词能力强,有稳固性,往往又能显示它的普遍性。”周祖谟(1959)以及后来黄伯荣、廖序东(1997)和邢福义(1986)都认为,基本词汇的这3个特征是就基本词汇的整体来说的,并不是所有的基本词都全部具有这3个特征。赵振铎(1959)也认为,3个标准不可以生搬硬套,搞一刀切。因为某些词只符合两个标准而不符合另一个标准,就把它排斥到基本词汇之外是错误的,应该根据词汇的特殊性作出判断。
(3)基本词汇研究存在问题
① 缺乏明确的研究目的
国外对基本词汇的研究事先都有一个明确的目的,有的是为了找出语言中普遍存在的词汇或概念作为基元,用于语义分析,如,Wierzbicka,或编制人工语言,如,Leibniz(1677)的人类思维字母(Alphabet of human thought)或柴门霍夫(Zamenhof)的世界语。后来更多基本词汇的研究是为服务于外语教学,作为教学中的择词依据或测试标准,如Ogden的基本英语,West的通用词表以及后来的Nation的大学词表都属于这一类。相比较而言,对汉语基本词汇的研究始终缺乏明确的目的,因而也只能局限于对细枝末节的争论。在初期,学者们之所以会对基本词汇如此关注,很大程度上是因为政治人物的讲话,斯大林本身并非语言学家,但是他的特殊身份使他所有的讲话都具备了研究的意义。他谈到了基本词汇的问题,语言学家们自然而然就关注起这一问题。所以就研究的动因而言,政治因素要胜过学术因素。事实上,如果学者们一开始就确定了基本词汇的研究目的,许多疑问就可以自然解开。假设基本词汇是服务于语文或对外汉语教学,则能产性和全民性是首要因素,因为那些使用频繁或构词能力很强的词汇是学习者必须掌握的。其中能产性的特征主要针对基本语素或单字词而言,学生只有掌握了基本语素,才可能进一步理解词汇意义,并且举一反三,达到触类旁通的效果,所以小学生或汉语初学者总是从字开始学起,然后扩展到词和短语。此外,全民性的特征也是必须的,这可以保证选择的词汇与大众生活紧密相关,排除专业术语、方言或过于书面化的用语。最后,稳固性也可以作为参考,这一原则就将某一特定历史时期,如文革时的流行词汇应排除在外。从历史语言学的角度来看,语言总是不断变化的,但在某一时期又具有相对的稳定性,所以除了历时的稳固性外,还要考虑共时状态下的稳固性。共时的稳固性体现在词汇在不同的语体中、以及不同的语域中使用的一致性,例如,“毛驴”和“毛驴儿”相比,后者在分布地域上缺乏稳固性,所以不属于基本词汇。由此看来,有了明确的研究目的,对基本词汇标准的甄别就一目了然,可以避免许多不必要的争论。
② 缺乏动态的研究视角
以往的学者们大多关注的是基本词汇的几个原则是否必须全部满足,如果不能,哪个原则是最重要的,哪个是可以偶尔违背的。他们将这三个原则看作万能的准绳,希望借此明确地将基本和非基本词汇区分开来,所以每当出现个反例,总会引起一番争论,因为规则如果一再地被违背,就等于没有规则,必然有人会积极维护规则的权威性。这种观点与亚里士多德的范畴理论一脉相承,即:范畴被认为是抽象的包容物,事物要么在范畴内,要么在范畴之外,只有具有共同属性的事物才属于相同的范畴,共同属性是范畴存在的决定因素。这种静态的视角并不符合人们的认知规律,认知研究表明,并非所有范畴成员都具有相同的属性,而且各类概念范畴的边界并不总是绝对存在,相邻范畴不是由严格的边界截然分开的,边缘成员往往混入对方的类别。就具体范畴而言,各个成员地位也是不等的,有的成员具有较多的范畴特征,而有些具备的特征较少,于是,前者就称为原型成员,后者为非原型成员。这种原型的观点将范畴的划分动态化,有形的准绳变成模糊的范围,用该理论解释基本词汇的种种现象,许多问题也就迎刃而解。基本词汇本身是一个模糊的范畴,其成员可能有的具备了三个特征,有的只具备其中的一个,前者属于基本词汇中的典型成员,后者为非典型成员,典型的基本词汇与非基本词汇间存在截然的差别,但非典型的基本词汇与非基本词汇间的差别往往很模糊,但是这并不妨碍基本词汇这个范畴存在。所以,基本词汇的三个特征是存在的,但是只是动态地体现在整个范畴中,而不是静态地存在于每个词汇中。
③ 缺乏必要的量化研究
学者们对基本词汇特征静态的把握给其界定带来很大的困难,也妨碍了进一步的量化研究。迄今为止没有哪位学者对基本词汇的数量作过预测,以往所有的研究在谈到基本词的时候都几乎是千篇一律地举出几十个、上百个基本词作为例证,对理论或实践的指导作用不大。杨同用(2003)收集了各类教材中所列的基本词汇的例子,指出教材的编写者在举例时都非常保守,尽量同时满足稳固性、能产性和全民性三个标准,很多例子都被重复采用。下面是他对8种著作或教材中基本词汇例子的统计和整理。这八种著作或教材的作者分别为:符淮青(1985)、北京大学中文系现代汉语教研室(1993)、杨润陆等(1995)、张志公(1982)、林祥楣(1995)、叶蜚声、徐通锵(1997),马学良(1985)和高名凯、石安石(1963)。
在8种教材中出现6-7次的有12个:
火、水、天、山、地、刀、一、走、西、吃、东、手
在8种教材中出现4-5次的有36个:
白、大、脚、千、秋、飞、春、车、十、头、心、牛、小、月、人、日、鱼、船、树、说、马、上、下、北、看、年、羊、草、二、三、想、生、我、风、红、雨
在8种教材中出现2-3次的有68个:
百、笔、布、菜、长、锄、窗、弟、电、冬、肥、肺、斧、父、高、好、海、喝、黑、后、厚、短、多、坏、花、见、来、蓝、梨、雷、美、门、米、母、南、你、鸟、女、跑、前、去、少、丝、死、四、田、甜、听、土、吐、万、网、细、夏、兄、血、眼、右、云、嘴、左、星、丈夫、妻子、鼻子、女儿、儿子、耳朵
在8种教材中出现1次的有83个:
爸爸、哥哥、弟弟、叔伯、妈妈、帮助、父母、姊妹、兄弟、休息、舒服、破坏、太阳、月亮、眼睛、高兴、困难、工作、上午、下午、薄、鼻、肠、尺、出、吹、粗、寸、稻、灯、低、儿、耳、分、个、狗、瓜、果、河、湖、江、姐、斤、进、苦、冷、两、流、绿、买、麦、妹、木、拿、那、男、气、浅、轻、取、热、舌、深、他、跳、晚、胃、问、屋、五、线、香、牙、烟、油、玉、早、长、这、针、重、猪、做
上文所列基本词汇共199个,从数量而言还远远不够。众所周知,汉语一部普通的《新华字典》所收单字有一万一千多,《现代汉语词典》共收字、词六万多,这数量不到两百的词汇定然无法反映汉语中基本词汇的全貌。此外,从存在形式看,199个词汇中只有26个双音词,其余均为单音词,这与正常的词汇概念不太吻合,因为一般认为的词汇应该更多的是双音词。出现上述情况主要原因是研究者们被基本词汇的三原则束缚了手脚,尤其是其中的能产性这一原则使许多学者对双音词的基本词汇地位心存疑惑,所以只能围绕常见的单音词反复举例。最后,从分布范围看,除了偶尔有一两个量词外,没有其他虚词,都是实词。在实词中也只有具体的名词、动词和形容词,没有抽象的实词。这些不足之处都是由于缺乏必要的统计量化工作而造成的。在基本词汇提出之初就缺乏必要的手段和工具对其进行数据分析并全面提取,只能依靠内省和经验简单罗列,这种做法在基本词汇后来的研究中被一直沿用,量化研究始终没能做到。
(4)小结
基本词汇这一概念提出已有五十多年了,但它并没有对语言的研究与应用起到推动作用,学者们更多地是忙于给斯大林的文章做注解,浪费了许多精力。现在看来以往对基本词汇的研究目的不明,理论不清,工具不足,这些都阻碍了对其进一步的探讨。基础词汇未来的研究应该与语文教学和对外汉语教学相结合,灵活运用其三原则,理论与实践相结合。具体体现为:利用词频统计结果和现代汉语词汇、语法研究成果,开展有系统的词汇量化研究,大大扩展基本词汇的数量和范围,制订不同级别的基础词汇表,并根据该词表编写相关教材和语言学习词典,设计教学重点,研究学习策略,推动语文教学和对外汉语教学的发展。
2. 汉语词汇的量化研究
“词汇计量学”(德语Lexikometrie,英语lexicometrics)一词是德国学者凯尔(Keil)(1965)在《词汇计量学中的统一方法》(何克抗、李大魁,1987:80-81;程曾厚,1987:1、6、14-15)。西方对词汇的计量研究始于制订词表。公元10世纪盎格鲁—撒克逊学者艾尔弗里克(Aelfric)在《拉丁语法》一书里附有一张拉丁语—英语的分类词汇表。18世纪法国制定了一份包含54 000个词的词表用于聋哑儿童教学。19世纪末德国学者克定(F.W.Kaeding)首次进行大规模人工词频统计,涉及语料达一千万词,1898年出版《德语词频词典》,成为词频统计的经典著作。20世纪20年代以后,英、法、德等语种“基础词汇”词表陆续问世,使词典编纂用定量词汇释义的方法得以形成。电子计算机的出现使人们能够借助现代科技手段研究词汇的频率特征,与现代统计学结合,遂诞生词汇计量学,成为语言文字现代化潮流中一个异常活跃的领域。
汉语词汇的计量研究20世纪20年代开始起步,到80年代以后才有较大发展,但是编写常用词表用于语文教学的做法却由来已久。南北朝周兴嗣在公元535-543年间编写的《千字文》在各类启蒙读本兼字表中影响最大,流传最广。全书包含一千字,基本没有重复字,编成四言韵文,文理通顺,琅琅上口,代表了我国传统语文中词汇教育突出成就。
在近代,首先对常用汉字进行动态字频统计的是陈鹤琴先生,他和助手经过两年多艰苦的手工操作,统计了6类语料55万多个字符,于1928年6月得出汉字字种4261个,整理成《语体文应用字汇》,这是我国第一份语体文常用子表(刘英林、宋绍周,1992;程曾厚,1987:27)。首次对现代汉语词汇进行实际统计的,当推王文新(杨奔,2002)。1930年前后,他人工统计了910 417字的语言材料,最后得到小学生应学词汇共7 199个。他的材料来源有三个方面:各类国语教科书、各地小学作文原稿和小学儿童课外读物。
汉语词汇的量化研究尽管起步缓慢,但发展迅速,80年代以后各类以计量研究为基础的字表、词表层出不穷。据统计,在80年代到90年代这10年间就出现各类词表10多种(刘英林,宋绍周,1992:4),汉语词汇的计量研究不断在广度和深度上走向新的里程。迄今为止,有广泛影响和重要意义的词表或相关研究包括以下几种:
(1)《普通话三千常用词表》(增订本)
郑林曦等编,初稿出版于1959年,28年后重订,为推广普通话而编制,采取选择和统计、检验相结合的方法。研究者首先搜集收入常用词较多的词典、词表和出版物,制成初步草稿,然后征求一部分语言学专家,大、中、小学教师,语文书刊编辑工作者以及推普工作者的意见,做出初步增删。接着选择语文课本、会话、政论、书信、故事、新闻等体裁的普通话文章共11种,统计其中的常用词及其数量并与词表初稿作比较,再次修正,最后确定了收词3 624个的常用词表,常用率为80%,增订本收词3 996个,常用率达87%。该词表的特点是标有发音和词性,并且把将词汇按意义分类,如,名词被分为30个小类,有利于学习者联想和记忆。
(2)《现代汉语频率词典》
该书于1986年6月由北京语言学院出版社出版,240万字,是北京语言学院“现代汉语词汇统计研究”课题的重大成果。这项研究工作采用人工与计算机相结合的方式,对179篇样文、182万字的语料进行了词语切分、词频统计和数据分析的工作,统计的总词汇量为1 315 752词次,含不同单词31 159个,其中包括十年制语文课本(52万字,374 654词次)的字频和词频的定量分析,统计结果编成《现代汉语频率词典》出版。词典主要内容包括按音序排列的频率词表以及报刊政论、科普书刊、生活口语、文学作品、分布最广的词语频率表及其他统计结果。这次字、词统计结果,为中、小学语文课本的改进和科学化提供了依据;高频词和高频汉字字表的获得,对计算机的汉字录入软件设计和改进提供了依据。
(3)《现代汉语三千常用词表》
何克抗,李大魁主编,北京师范大学出版社1987年出版。该词表的编写目的是为了满足编写语文词典和中、小学语文教材的需要,并为从事现代汉语语音、文字、词汇、语法研究的语文工作者提供有价值的数据资料。北京师大现代化教育技术研究所部分研究人员同中文系部分汉语教师合作,利用两年多的时间,对全国统一使用的1983—1984年度的中、小学语文教村(共24册)作了大规模的词频统计与分析。词库的建立和词频的统计全部由电子计算机软件系统自动完成。共输入107万宇,约生成4万个词条,成段成篇的古文、外语、阿拉伯数字、脏话、黑话不作切分和统计,但人名、地名等专名同样纳入统计范围。然后,再利用计算机把频率值(即词的出现频度的高低)和方差值(即词在各种文体中的覆盖率)都达到某一界限以上的词全部挑选出来,确定为常用词。该词表改变了以往手工操作的做法,较早地利用计算机为手段,从而为科学地确定常用词提供了新的理论根据。其不足之处在于没有拼音和词性标注,且选择的词汇主要为书面语。其成果于1985年7月通过国家鉴定,除了编写《现代汉语三千常用词表》之外,还出版了《现代汉语词表》、《八千常用词表》和《一万常用词表》等书。
(4)《汉语水平词汇与汉字等级大纲》(修订本)
国家汉语水平考试委员会办公室考试中心制定,刘英林、宋绍周主编,1992年6月出第一版,2001年出修订版。编制的总原则有两个,一是多学科定量统计与群体性定性分析相结合,二是语言学科学原则与对外汉语教学需要相结合(刘英林、宋绍周,1992:6)。大纲以七个动态性频度统计词典、词表和字表为主要依据,编写过程经过了从目标定性开始,到定量再统计,又回到定性再删选,最后产生等级词表几个阶段。词汇大纲共收词语单位8 822个,包括甲级词1 033个,乙级词2 018个,丙级词2 202个,丁级词3 569个。包括词汇等级大纲和汉字等级大纲两部分,分别按级别排列和音序排列。2001年大纲出版修订本,修订后各个等级的词汇总数保持不变。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。