中国图书在版编目主题标引探讨
陆宗城 张桂凤
一、引 言
目前,我国图书在版编目数据(以下简称CIPD)中的主题标引工作(以下简称在版主题标引)是按国家标准《图书书名页》(GB 12450—90)、《图书在版编目数据》(GB 12451—90)及《文献叙词标引规则》(GB/T 3860—1995)进行的。笔者最近做了随机抽样调查(以下简称调查),发现在110种有CIPD的各类中文图书中,做手检主题标引的占96. 4%(106种),做机检主题标引的只占3.6%(4种)。
近来刊物上发表了几篇文章,论及CIPD的质量问题,但大多只涉及著录和分类方面,对在版主题标引的质量做评价的只有3例,且都浅尝辄止。我国图书馆界和出版界对图书的主题标引大多缺乏实践经验,以致在版主题标引中的问题特别多,因而更加值得探讨。
二、在版主题标引问题
(一)质量问题综述
我国在版主题标引,一般以先组散组式的人工整体浅标引为主,旨在编制卡片式的主题目录。我们调查结果,做手检标引的106种图书中,标引质量较好的占33%(35种),有问题的却占67%(71种)。现将各类质量问题列表(见表1):
表1 在版主题标引各类质量问题
注:有的书存在不止一个质量问题,故合计数大于71种。
我们调查发现的机检标引问题:一是标引深度距国家标准要求太远;二是自由词的使用失去控制,竟占标引词的42. 6%;三是从题名中抽取标引词占69. 2%,忽视了相应专指词的使用。由于我们抽查的书中做机检标引的太少,故不作进一步分析。
(二)标引深度问题
《文献叙词标引规则》规定,“手检系统平均标引用词2~5个,机检系统平均标引用词4~10个”[1]。据我们的调查,手检平均标引深度为3. 57,应该说是不够高的。这大多是由于没有做深入的主题分析,特别是对隐含因素的发掘不够。而机检标引的平均标引深度竟只有3. 25,不仅大大低于国家标准的规定,甚至低于手检平均标引深度。适当提高标引深度能更好地揭示文献的内容和形式。CIPD的手检标引深度尚可适当提高,而机检标引深度则须大大提高。
(三)检索深度问题
《图书在版编目数据》规定,“一部书的主题检索点一般不超过3组(不包括同一组数据的轮排)”[2],即检索深度一般不超过3。我们的调查结果显示,手检主题标引的平均检索深度仅为1. 22,与上述规定相差较远;比之美国CIPD中“每本书的检索深度为2. 57”,[3]则尚不到一半。这说明我国的CIPD为读者提供的主题检索入口太少,严重影响了图书的利用。我国主题检索深度低的原因,主要是大部分图书只做粗浅的整体标引。我们的调查结果表明,13种明显应做分析标引的书,有92. 3%(12种)未分析;40种应做轮排的书,有90%(36种)未轮排;30种应做分组标引的书,有53. 3%(16种)未分组。
(四)标引选词问题
根据我们的调查结果,110种书共使用了391个标引词,其中叙词占89%(348个),自由词占11%(43个)。从表面上看,标引用词以叙词为主,这是好的,但选词问题却非常突出。究其原因:一是在将文献主题概念转换成检索语言时,往往简单地将题名中的叙词做字面组配,违背了应做概念组配的要求;二是表中有专指词,却用了泛指的叙词;三是有些该增词的,却用了上位叙词或相关的叙词。这些问题的产生,主要是标引人员的选词方法欠妥;其次是《汉语主题词表》和《中国分类主题词表》都没有轮排索引,给准确选词带来了困难。
(五)组配标引问题
《文献叙词标引规则》规定,在没有与文献主题概念直接相对应的专指叙词时,应选用最密切、最邻近的叙词做概念组配标引。[4]我们的调查结果显示,在组配标引的图书中,组配明显欠妥的共有23种,其中属单纯字面组配的8种,占34. 8%;组配词序或引用次序不当的7种,占30. 4%;应做交叉组配而用了方面组配的4种,占17. 4%;应做连接组配而未做的3种,占13. 04%;还有应组配标引而采用了增词标引的1种,占4. 3%。
三、典型差错分析
CIPD在我国还是新生事物,难免会出现各种各样的差错,主题标引更是这样。为了改进在版主题标引工作,更好地开发和利用文献资源,现列举若干手检主题标引的典型差错如下:
1.计算机信息检索/李莹等编著。——北京:机械工业出版社,1997年3月。原标引为:机器检索(经中国版本图书馆核定,以下简称经核定),该书除论述计算机检索一般原理和方法外,重点论述了Internet信息检索、Dialog联机检索、光盘信息检索和书目检索,内容新颖,颇具参考价值。我们认为除原标题外,应增加如下标题:①Internet+—情报检索;②Dialog+—联机检索;③光盘—情报检索。(注:有“+”者为新增词,下同。)
2.现代气功学/冯理达著。——北京:经济科学出版社,1994年10月。原标引为:气功学—现代(经核定)。这一标题只是题名的分拆。本书用免疫学的理论和方法,研究我国传统气功,奠定了现代气功学的理论基础,使传统气功获得了科学依据。全书分基础理论和科学研究两部分,共收论文51篇。应标引为:①气功学—基础理论—现代—文集;②免疫学—影响—气功学—文集;③气功学—影响因素—免疫学—文集。
3.手术学全集:整形与烧伤外科卷/黎鳌等主编。——北京:人民军医出版社,1996年12月。原标引为:外科—手术—整形外科学—烧伤—全集(经核定)。全书共13卷,类似于《不列颠百科全书》的Macropedia,由专家分别撰写专文,全面介绍各种外科手术。本书为专论整形外科与烧伤外科的分卷。应同时对全书和分卷做标引,其标题应改为:①外科手术—百科全书;②整形外科学—外科手术—百科全书;③烧伤—外科手术—百科全书。
4.急性中毒的诊断与救治/陈世铭、高连永主编。——北京:人民军医出版社,1996年11月。原标引为:中毒性疾病:急性病—治疗—手册(经核定)。我们认为应做轮排和分组标引,故可增加如下标题:①中毒性疾病:急性病—诊断—手册;②急性病:中毒性疾病—治疗—手册;③急性病:中毒性疾病—诊断—手册。
5.社会发展策略/徐俊等著。——北京:红旗出版社,1996年9月。原标引为:社会—发展—战略—研究—中国(经核定)。本书为《21世纪中国战略大策划》丛书中的一部,主要从优化社会结构、未来生存与发展、影响今后社会发展的因素等方面,具体探讨了21世纪我国社会的发展战略。原标题基本上是从题名抽词组配而成;但《词表》中有“发展战略”与“社会发展”两个专指词,故应标引为:①社会发展:发展战略—研究—中国—21世纪;②发展战略:社会发展—研究—中国—21世纪+。
6.恩波智业—敢对自己说我第一卷/王力著。——北京:北京大学出版社,1995年1月。原标引为:决策—咨询—理论(未经中国版本图书馆核定,以下简称未核定)。本书作者是恩波智业研究所所长。他借事抒情、夹叙夹议地在书中概述了在为他人决策做咨询服务过程中的种种经历和体会。本书属随笔著作,没有具体阐述决策咨询理论,可改标为:①咨询服务—随笔;②随笔—中国—现代。
7.植物资源专项调查研究报告集/何关福主编。——北京:科学出版社,1996年6月。原书标引为:植物资源—自然资源—调查研究—文集(经核定)。本书题名明确反映了原书主题概念。原标题中,自然资源一词为上位词,没有标引必要,故可改标为:植物资源—调查研究—研究报告。
8.暴力犯罪预防与制服对策/王岩等编。——北京:中央编译出版社,1994年9月。原书标引为:社会问题—暴力—犯罪—研究(未核定)。此书是阐述社会治安综合治理的普及读物,从分析暴力犯罪的典型案例入手,提出预防和制服暴力犯罪的对策,并未论及其他社会问题。故原标题中,社会问题一词应删除,并应提高词的专指度,可改标为:①刑事犯罪—暴力—预防—普及读物;②刑事犯罪—暴力—治理—普及读物。
9.中国人民大学经济研究报告:市场化改革整体推进条件下的中国经济/袁宝华等编。——北京:中国人民大学出版社,1995年9月。原标引为:社会主义经济:市场经济—经济体制改革—经济发展—中国—研究报告(经核定)。本标题在选词上没有明显的不当之处,只是“社会主义市场经济”一词已有很高的标引频率,今后仍将不断出现。这一主题概念无需用社会主义经济和市场经济两词做交叉组配标引,应增“社会主义市场经济”一词,以提高标题的直观性,同时可省去轮排标题,加之原标题过于冗长,故可改标为:①社会主义市场经济—经济发展—中国—研究报告;②经济体制改革—中国—现代—研究报告。
(10)矩阵光学/阎吉祥等编著。——北京:兵器工业出版社,1995年8月。原标引为:矩阵—光学(经核定)。此书以线性矩阵变换为数学工具,系统介绍工程光学和光电子学中的主要光学原理与应用。原书标引存在两个问题:①矩阵光学已成为一门独立的学科,应直接增词标引;自然科学著作往往兼论原理和应用,为了减少分组标引,应增加“理论与应用”一词,故本书可标引为:①矩阵光学;②工程光学—理论与应用+;③电子光学—理论与应用+。我们依据有关国家标准[5],并以《中国分类主题词表》为标引工具,对上述10种书重新做了手检主题标引,现与原标引数据对比(见表2)。
表2 两种标引的数据对比
表2说明,按我们提出的标题统计,平均标引深度与检索深度均未超过有关国家标准[6]的规定,可供同行参考。
四、关于改进在版主题标引的建议
(一)标引方式的改进
1.改手检标引为机检标引。在国外,凡已实现计算机检索的图书馆,手检主题目录大多已停编。如美国国会图书馆实行机检的年份分别是:英文书1968年,其他西文书1973年,别的文种图书1980年。从同年起分别停编相应文种的手检主题目录,原编目录则继续供读者做回溯检索之用。然而在他们的CIPD中,仍然做手检主题标引。这是由于一些未实现机检的图书馆,仍在采用它们的在版主题标目来编制主题目录。我国图书馆除北京图书馆(以下简称北图)外,一般不编制主题目录,因此基本上没有历史包袱。随着机检在图书馆的逐渐普及,我国图书的在版主题标引仍然做手检标引,已经完全不合时宜。我们调查中发现做机检标引的这4种书,倒是代表了今后的发展方向。改为机检标引后,个别图书馆若继续编制手检主题目录,则可自行在机检标引词中选词,组配成主题标目也较方便。
2.改浅标引为适度标引。在手检标引条件下,为了节省编制主题目录的人力、物力,对标引深度及标题的级数都做了种种限制,这对开发利用文献资源、方便读者检索是极为不利的。改为机检标引后,标引深度完全可以按图书内容和形式的检索意义来确定,不必过多地加以限制。该分析的、该综合的、该专指的、该增词的都可以放手标引,只要做到适度就行。
3.改人工标引为人机结合标引。目前,我国CIPD中的主题标目以手工标引为主,效率低,成本高,质量差。但若完全改为机器标引,则条件尚未成熟,勉强采取机器抽词标引,查全率必然低,检索效果就差。我们认为,当前宜采用计算机辅助的人工标引,即由人工来分析文献主体概念,以机读的后控词表为标引工具,进行人机结合的赋词标引。一旦条件成熟,还可以改为由机器抽取关键词,并自动转换为受控词标引;读者可以用关键词检索,同样由机器转换为受控词。这样就可以实现标引语言和检索语言的匹配,达到高效率和高质量的标引和检索。
(二)加强组织管理
1.改自愿实施为强制执行。目前我国的CIP基本处于无组织的状态,主要由各出版社按主观意愿进行;有的搞,有的不搞;编目数据有的送审,有的不送审;即使同一家出版社,在同一时期内,有的搞,有的不搞;有时送审,有时不送审,置有关国家标准于不顾。据统计,全国共有519家出版社,而实际与国家新闻出版总署信息中心CIP处建立CIPD审核关系的仅200余家。[7]杭州大学图书馆陈霞佩为本文所做的统计表明,该馆1997年4月新到部分图书(760种),有CIPD的仅占33. 6%(255种)。我们调查有CIPD的110种图书中,未经核定的占30. 9%(34种)。之所以造成现在的这种局面,主要原因有:①国家虽然制定了有关的各项标准,但没有配套的强制性实施法规;②出版部门对CIP的作用认识不足,甚至把它当作一种负担;③有些省、市出版部门过多地考虑经济利益,自己没有能力搞,又不让别人搞。高质量的CIPD必然会减少重复劳动,方便读者检索,有利于文献资源的开发和共享,并为联机检索打下良好的基础,也将给出版管理部门实现图书出版和发行的监督管理创造极好的条件。因此,图书的CIP必须强制实施,凡是没有CIPD的图书都应视为不规范的出版物,对此类出版物,国家新闻出版署要制定相应的法规,明确规定《新书征订目录》、《全国新书目》、《国家书目》等都不予收录、报导,并视情况在经济上适当予以制裁。
2.改分散进行为集中编目。现有的CIPD中无论是著录、分类还是主题标引都存在很多问题,说明CIP分散进行很难保证质量,因而在全国缺乏权威性,实际上没有起到应有的作用。国外的CIP工作一般都集中进行。美国、英国和澳大利亚等国多由国家图书馆负责;苏联虽由图书馆派员去出版社做CIPD,但由国家图书馆负责技术指导。由图书馆负责此项工作,质量较有保证。目前我国的CIPD问题甚多,最突出的是主题标引问题。而北图在这方面有优势,而且该馆长期向全国发行带有集中编目性质的统编卡和出版《国家书目》,因此,由北图集中负责CIPD的编制工作是合适的。毋庸讳言,过去北图的统编卡也有这样那样的问题,但主要是发行不及时。现在,我国的国家基础设施正在迅速改善,出版社与北图及北图与各大图书情报机构之间的联系,越来越多的已可采取电子函件等先进手段,在编目数据的传递速度上已基本不成问题。当然,北图也要调集精兵强将从事此项工作;原负责审核CIPD的人员仍可参加到此项工作中去;必要时国家技术监督局可成立CIPD的审核机构,派驻北图对CIPD的质量进行监督;同时根据当前需要对有关的国家标准做必要的修改。只要采取先进手段,国家统一管理,必能大大提高CIPD的质量,真正做到一家编目、全国享用。
(三)提高人员的业务水平
1.集中编目情况下的队伍建设。要提高CIPD质量,除了须调集精兵强将之外,还要不断补充和提高这支队伍的理论水平和实际操作能力。美国CIP和原始编目人员本来须具有大学本科文化背景,再加上图书情报学的硕士学位即可;而按目前趋势,要具备双硕士学位的人方能胜任此项工作。就主题标引而言,我国采用叙词表标引,难度比用标题表大,因此对人员的要求,至少应接近或与美国持平。就我们所知,我国图书情报界具有硕士学位并有主题标引实践经验的人为数尚少,还需要大力培养;已经从事此项工作的人员也亟待进修提高。在CIPD亟待全面铺开之际,队伍建设更是一个关键。各个基层图书馆并不能因为CIPD集中编制,而放弃培养著录和标引人才。因为各个图书馆都有可能要做原始编目,并将数据提供给全国共享;同时,各馆对CIPD也需要加以校核。各图书情报单位要保持一定数量的、水平较高的编目人员。根据我国情况,主题标引人员的培养和提高更为迫切。高校要加强主题标引的教学和举办培训班,以弥补这一缺口。
2.分散编目下的队伍建设。若CIPD一时做不到集中编制,而维持目前由各出版社各自为政、由出版部门自行核定的局面,则人员培养和提高的任务将更重。当前CIPD质量问题比较严重,正说明了大多数出版社缺乏高水平的系统掌握CIP知识和技能的人员,尤其是主题标引人员。目前负责审核CIPD的人员尚不足25人,年审核的CIPD不到3万条[8],与实际需要相差甚远。因此,大学出版发行专业也要设置或强化编制CIPD的有关课程。目前各出版社从事CIP工作的人员,须经严格考核、持证上岗,以维护国家标准的严肃性。国家新闻出版总署和省、市新闻出版局都应聘请专家,为出版社开办各种形式的培训班、进修班,以此来培养和提高CIP在职人员的专业能力和素质。对目前还没有条件编制CIPD的出版社,应迅速聘请著录、分类及主题标引方面的专业人员担任这一工作;同时可采取师傅带徒弟的方式,邀请老专家帮助培养新生力量,保质保量地完成CIPD的编制任务。
五、结束语
我国CIP实施较迟,出现一些问题,特别是在缺乏实践经验的主题标引方面,这是在所难免的。由于我们是用叙词表做标引工具的,比用标题表标引更能贴近文献实际。所以,只要我们图书馆界和出版界加强合作,努力改进,我们的标引质量是能够达到甚至超过其他国家目前的标引水平的。将来改手检标引为机检标引,我国比较容易实现,因此,后来居上是完全可能的。
(原载《中国图书馆学报》1998年第1期)
【注释】
[1]中华人民共和国国家标准:文献叙词标引规则(GB/T 3860—1995)。
[2]中华人民共和国国家标准:图书在版编目数据(GB 12451—90)。
[3]张琪玉、刘湘生主编:《中国分类主题词表教程》,华艺出版社1994年版。
[4]中华人民共和国国家标准:文献叙词标引规则(GB/T 3860—1995)。
[5]文榕生、张玉麟:《我国图书在版编目(CIP)状况》,《图书馆理论与实践》1996年第3期。
[6]文榕生、张玉麟:《我国图书在版编目(CIP)状况》,《图书馆理论与实践》1996年第3期。
[7]文榕生、张玉麟:《我国图书在版编目(CIP)状况》,《图书馆理论与实践》1996年第3期。
[8]文榕生、张玉麟:《我国图书在版编目(CIP)状况》,《图书馆理论与实践》1996年第3期。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。