期刊论文主题标引,就是对期刊中每篇论文进行主题分析,赋予主题词(规范化叙词或关键词)的过程。通过对期刊中每篇文献所赋予的主题标识,将原来无序的、分散在各期刊中的文献信息转化为有序的、便于查找的集合,从而为从主题角度进行期刊文献检索提供可能,为计算机迅速检索创造条件。因此,期刊标引是期刊检索和利用的关键环节之一,期刊标引质量的高低将决定期刊的检索效率。
(一)衡量期刊标引质量的因素[21]
期刊标引工作质量的衡量,涉及多种因素,如:标引的准确性、针对性、适用性、相关性、成本费用等,但其中最核心、最关键的因素则是标引的专指性、网罗性、一致性。
1.专指性
专指性,亦称专指度,是指主题标识与期刊文献主题概念的相符程度。它是根据对主题概念揭示的精度衡量标引质量的一个因素。较高的专指度,有助于提高检准率,满足用户对特定文献的查找。
2.网罗性
网罗性,也称网罗度,是指一篇文献所论述的各个主题概念被确认并转换成检索标识的完备程度。较高的网罗度,有助于提高检全率,满足用户多途径查找文献的需求.但网罗度并非越高越好。网罗度越高,反而“冲淡”了重要的主题,影响检准率。因此,要控制网罗度,作适度标引。
3.一致性
所谓一致性,是指标引人员对同一主题内容文献标引的一致程度。它可以指不同标引人员之间对同一主题内容的文献标引的一致性,也可指同一标引人员在不同时期对同一主题文献标引的一致性.提高标引的一致性,有助于集中同一主题内容的文献,_提高检全率和检准率。
其中,专指性取决于标引人员对文献主题分析的正确性和从标引工具选取叙词的针对性和准确性;标引的网罗性依赖于标引人员对文献专业范围了解的全面性;一致性取决于标引人员对该主题内容的认识。
主题标引是一项细致而复杂的文献加工工作,它不仅要求标引或编辑人员从主题标引角度去进行文献加工,还要求标引人员或编辑有一定的信息知识,要了解文献内容的实质,作者的意图乃至读者检索文献的要求,要有语言学、逻辑学、计算机检索原理等方面的知识,还必须掌握标引的原理和技巧,这就给期刊编辑人员带来新的研究课题,并对其自身素质提出了更高要求。
(二)期刊标引的种类[22]
目前,我国期刊标引工作中,常见的方法有两种:键词标引和叙词标引。
键词,又称关键词,它是从文献的题目。文摘或正文中抽出的具有真实意义的词、词组或短语,是一种未经选择和规范化的自然语言。它语言丰富、灵活、覆盖面广,能更准确地表达文献的中心内容。键词标引具有速度快、方法简便、易于掌握的特点,在普遍采用联机检索中,关键词具有良好的相容性,它的使用极显著地提高了查准率,给使用者带来方便。但易造成漏检。
叙词标引是指对期刊论文进行主题分析,提炼出主题概念,并转化为规范化主题词的过程。这些词汇可以不同于文献作者在文献题目或正文中所用的词汇,同时主题词表有一定的专指度的限制,不是每个概念都能找到对应的主题词,有些较窄概念需要上溯到较广的概念,才有相应的主题词,如“指事”、“象形”、“转注”、“假借”、“形声”、“会意”等都用其上位概念“六书”来标引;有些较广泛的概念又要细分到较专指的概念,才有相应的叙词。因此,叙词标引“人为性较强”,不易掌握,标引速度较慢,但它把同一涵义或相近主题用同一规范主题词表示,提高了文献的检全率。
叙词标引和关键词标引各有其优缺点,叙词标引由于查表的繁琐以及期刊论文研究内容的专深,词表中的主题大多难以满足期刊的需要,因此,我国目前使用最普遍的还是关键词标引。这一标引的实施,为广大科研人员检索带来了极大方便,但同时我国期刊标引在技术和方法上尚有许多不成熟之处。
(三)常见标引错误类型分析[23]
我国期刊标引工作中,常见的错误有以下几种:
1.主题内容提炼过多导致过度标引
提炼出的主题内容多于文献本身含有的主题内容或所占分量小或不符合检索系统的要求,将会导致过度标引。
例:《建立社会主义市场经济的理论是马克思主义的重大发展》
关键词:社会主义市场经济马克思主义科学体系经济体制模式实践第一中介生产力标准
该标引中的“实践第一”、“生产力标准”、“中介”等词虽在文中出现过,但并非本文的核心词,当我们从这其中任何一个词检索该文献,都会发现与我们真正的检索要求不吻合,主题提炼过多,导致过度标引。正确的标引为:
社会主义市场经济理论发展的马克思主义
2.主题重复标引导致过度标引
标引所反映的主题从字面上看不同,实际是同一主题,或者是上、下位关系,表面上看标引深度增加了,但所反映的信息量并没有增加,因而是无益的。
例:《电化学酶免疫分析法测定甲胎蛋白》
关键词:电化学分析极谱分析免疫测定甲胎蛋白抗体
其中“极谱分析”是“电化学分析”的下位概念,“抗体”是“甲胎蛋白”的上位概念。因此,正确的标引为:
电化学分析免疫测定甲胎蛋白
3.主题提炼不全导致不足标引
漏掉了有价值的主题,将降低标引深度,影响查全率。
例:《我国西北地区黑腹果蝇P-M杂种劣育的研究》
关键词:P转座因子细胞型卵巢劣育率
该标引漏掉了核心词“细腹果蝇”,当从这一主题词检索该文献时,就会查不到。
正确的标引应为:黑腹果蝇P转座因子卵巢劣育率
4.违反专指性规则的过粗标引
有专指叙词而用泛指词标引,会引起错检,影响文献查准率。
例:《略论中国政治制度史的研究、现状、研究内容及其重点》
关键词:中国制度史现状内容重点
该标引中“制度史”太泛,不够准确,用该词检索的文献不仅包括政治制度史,也有文化制度史、经济制度史等的内容。正确的标引应为:中国政治制度史
5.组配标引误差
这主要指用字面组配标引而不用概念组配标引所犯的错误,也是初搞标引的人最易犯的错误。
例:《建设有中国特色社会主义的根本法律保障》
关键词:宪法中国特色社会主义根本法律保障
这是一篇纪念宪法颁布十周年的文章,作者从现行宪法的指导思想、基本精神、主要特点论述了现行宪法是建设有中国特色的社会主义的根本法律保障。该标引所犯错误就是仅从字面拆词而不是概念的分解与组合。正确的标引应为:中华人民共和国宪法指导思想。
6.没选关键词
这是由于标引人员缺乏标引经验所致。
例:《魏晋南北朝历史编纂学简论》
关键词:博采考证凡例创新文笔简约
这一组词均非核心词,都没有独立检索意义,标引关键词.正确的标引应为:
历史编纂学魏晋南北朝
标引误差种种,除标引人员的素质外、也由于标引技术复杂,难以掌握,期刊标引缺少规范。为保证期刊检索效率,提高标引质量,必须对标引的程序、方法、原则有一定的规范。
(四)标引程序
主题标引工作一般应包括下列基本步骤:审读文献一主题分析一主题概念转化一选取标识词一审核。
1.审读文献
这是期刊标引的前期准备。a.首先要阅读标题。大多期刊论文标题都能准确地表达该文的主题,尤其是科技期刊论文更是如此。b.详细阅读文摘。文摘大多由作者或编辑写成,是对全文精确地概括和总结。阅读文摘,可进一步把握作者的论点和意图。c.阅读全文。除以上两方面阅读外,还可通读全文,准确地把握其核心,详细了解本文的论点、论据、结论。
2.主题分析[24]
这是标引的关键,分析的正确与否,直接关系到期刊标引的质量。a.首先对文献主题的类型进行分析,分析它是单主题还是多主题。单主题是指一篇论文只讨论一件事或一个问题,如《杜威“思维五步法”新探》一文,就是研究杜威的“思维五步法”,属单主题;多主题是指一篇论文讨论两个或两个以上的问题,如《作为小说的希腊神话和中国神话》,它包括“作为小说的希腊神话”和“作为小说的中国神话”两个主题。b.其次,要分析是否有隐含主题。所谓隐含主题,是指文献标题中没出现,实际上却具有检索意义的主题,如《不同文化中的相同悲剧一试论格莱姆斯夫人和祥林嫂的悲剧形象》,仅从标题看,该文主要从不同的文化背景比较了格莱姆斯夫人和祥林嫂两个悲剧人物形象,这是显性主题。除此之外,它还暗含着“鲁迅的《祝福》和舍伍德·安德森的《林中之死》两部短篇小说的比较”这一隐含主题。对于研究《祝福》或《林中之死》的人来说.第二个隐含主题也有检索意义。c.确定各主题要素。对以上分析出的每个单主题,分别析出其主体要素(表示事物、学科或问题及其方面、对象、部分、并具有独立检索意义的词或词组),通用因素(指类无专属,无独立检索意义的主题词,如“方法”、“设计”等)、位置因素(主要指国家、地区等表示地理位置的主题词)、时间因素。对主体因素还需进一步分析其核心词和限定词(见图4-1)。
图4-1 主体因素分析:核心词和限定词
3.主题概念分解转化[25]
这是保证主题标引质量的重要步骤。不经过这一步骤,很难判断选取的标识词是否能起到表达主题内容的作用,是否具有检索价值。如上例《电化学酶免疫分析法测定甲胎蛋白》、分解为“电化学分析”、“免疫测定”、“甲胎蛋白”;“旬河上、中游及邻区”分解为“旬河流域”、“秦岭山脉”;《森林植被的区系组成》分解为“森林植被”、“植物区系。”当进行概念分解时,应避免仅从字面上分解、分拆。此外,还应注意以下概念的提取与分解:a.主题中表达研究对象及其组成部分的概念;b.主题中和作者的新观点有直接联系的概念;c.主题中涉及的最重要的研究资料。
4.选取标识词(包括叙词选取和关键词选定)[26]
叙词标引是利用特定的受控词表,将析出的主题概念用词表中规范化的主题词加以转换的过程,一般应在了解词表各个组成部分功能和特点的基础上,根据查词规则、组配规则等进行转换。如:上例的“森林植被”通过查《汉语主题词表》,叙词标引选词用“森林植物”代替,若是键词标引,直接用“森林植被”即可。总之,对关键词的选词应以选准、选全为原则。
选准,就是要从分解出来的各部分概念中选取最恰当、最专指的词作为关键词,即必须是论文所属学科专用的、义项比较单一的词,不能是含义度宽泛的词。例如“中国解放战争”,就不能用“中国革命斗争”、“解放战争”、“‘中国”和“战争”等标引。为避免同一主题文献分散,提高关键词的准确性,在有条件的情况下,可根据《汉语主题词表》或中国科技信息所重庆分所编制的《中文科技期刊篇名数据库关键词用代表》来选词。
选全,就是指所选的关键词要与论文主题的范围和深度相一致。论文主题所涉及的每一个方面,一般至少应有一个关键词。因此,上例“旬河上、中游及邻区森林植被的区系组成的特征”最后选取的标识词为:
旬河流域秦岭山脉森林植被植物区系
5.审核[27]
审核是保证标引质量,减少标引误差的重要步骤。应根据标引要求,对主题标引工作的各个环节逐一进行核查,包括:主题概念的提炼是否准确、是否符合标引方针、对选用的主题词是否准确地表达了文献主题概念、主题标识的转换是否符合标引规则、主题标识的拟定是否符合检索工具的要求等。
为保证标引质量,还应制定和遵循各项标引规则。
(1)客观性规则。标引时,不宜考虑作者本身的政治立场和观点,更不应掺杂标引员个人的臆测和褒贬,应按其所论述的客观事物和研究对象进行标引。
(2)为读者出发原则。标引的目的是为了更方便地利用,标引人员应从读者检索的角度标引,尽可能满足用户检索需求。
(3)一致性原则。键词标引虽不严格要求查表,但对同一主题概念的标引应尽可能前后一致,以保证文献的检全率。如论述“酒精”的文献以前用“酒精”标引,以后凡遇有关酒精或乙醇的文献都尽可能用“酒精”标引和检索,不要随意变动。
(4)标引深度规则。不要过分追求标引深度,机械规定关键词的数量,应不多不少,恰如其分,以充分揭示原文为准。对难以把握其深度的,宁精勿滥,以免造成误检。
例《唐代道士在长安宫廷的活动及其影响》根据内容分析,应选取“道教”、“唐代”两键词,不应盲目追求其数量,大量提取键词“楼观台”、“道学”、“梦游天姥吟留别”、“复性术”等.当我们从“楼观台”检索到该文献时,它并非论述楼观台的建筑、结构、历史、发展。易误检。
(5)关键词性规则。选取的关键词,必须是有专业所属的,具有独立检索意义的词。通用因素主题词应尽可能少选或不选(最多只能有一个通用因素主题词)。
例:《陕甘宁边区赵占魁运动述论》
关键词:赵占魁运动陕甘宁边区工人运动作用意义
其中“作用”、“意义”是通用因素,本身无独立检索意义,只有跟“赵占魁运动”或“陕甘宁边区”、“工人运动”组在一起才有意义。因此,这两个词可不选或用一个词概括反映。
(6)专指性规则。必须选用与文献主题相对应的最专指的主题词进行标引,即当一个概念有多种组配方案时,应选用最确切的组配方式。如“经济管理”可用“经济管理”或“经济”和“管理”标引时,应选用“经济管理”为标识词。
(7)概念组配规则。避免字面组配代替概念组配。例《宽带低噪声放大器》,不能从字面分解为“宽带”、“低噪声”、“放大器”,只能从概念分解为“宽带放大器”和“低噪声放大器”两词表示。
(8)专有名词标引规则。专有名词不能用普通叙词组配标引,否则易失真.
例:《反法西斯抵抗运动与民族解放》
其中“反法西斯抵抗运动”为专有名词,不能标引为“法西斯”、“抵抗运动”,这易使人误解。又如“北京图书馆”,不能用“北京”和“图书馆”标引,前者指国家图书馆,后者指北京地区的图书馆。
(9)文学作品的标引规则。文学作品较特殊,对其研究的论文应从内容和作品两方面揭示、反映。
例“唯我论者的悲剧一论独幕剧《禁闭》”
该文不仅要从内容标引提取关键词“唯我论”、“悲剧”,还应从作品角度提取键词“《禁闭)”和“戏剧评论”,以使从作品名称亦能检索到此文。
(10)单一概念组配原则。虽然学术论文中的主题概念大多为复合概念。但键词标引要求单一概念,用多个单一概念的词或词组来反映一个复合主题概念。如“戏曲小说与中外文化”,应用“古典戏曲”、“古典小说”、“中外文化”表示,不能直接用“戏曲小说与中外文化”标引。又如“中国刑法学体系”,只能用“中国”、“刑法学体系”组配标识,不能直接用“中国刑法学体系”标引。
此外,对综述性论文,因其涉及面广、内容丰富,可选取覆盖面广、信息量大的主题词,专指度不一定很高,对于科学研究论文,因其本身对某一专题讨论的内容较深,标引应选择最恰当,专指性强的主题词标引。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。