首页 理论教育 叙词表的比较分析

叙词表的比较分析

时间:2023-02-27 理论教育 版权反馈
【摘要】:我国绝大多数的叙词表均属后组式检索语言。《汉表》、《社科表》和《经管表》基本上是后组式检索语言。学科的重合程度学科重合范围对词表的兼容转换性能具有最大的、最直接的影响。目前世界各国研制的兼容转换系统基本上都是针对某一学科。相同或相近领域词表的转换效果很好。词表结构的兼容程度一般说来,词表显示词汇的手段越多,则越容易实现转换。
叙词表的比较分析_情报检索语言的兼容转换

2.1 叙词表的比较分析

下面从四个方面对三种汉语叙词表进行比较分析。其中,《汉语主题语表》(简称《汉表》)、《社会科学检索词表》(简称《社科表》)和《经济学管理学论文题录索引词汇表》(简称《经管表》)。

(1)编制原则

编表原则对兼容性有最直接的影响。主要包括两个方面:第一,标引词的构造原则,即使用先组式还是后组式来构造标引词。我国绝大多数的叙词表均属后组式检索语言。《汉表》、《社科表》和《经管表》基本上是后组式检索语言。第二,词汇设计的原始目的。欧美国家的很多词表是为特定的馆藏或特定项目设计,而我国的大多数词表是按学科和专业的划分或分类来编制。比如《汉表》和《社科表》是按学科进行编制的,而《经管表》是为特定机检系统设计的。由于《汉表》和《社科表》属于综合性词表,词汇量大,专指度高,并有完善的参照系统,可以在一定程度上降低其影响程度。

(2)学科的重合程度

学科重合范围对词表的兼容转换性能具有最大的、最直接的影响。目前世界各国研制的兼容转换系统基本上都是针对某一学科。大量研究结果表明,综合性词表的兼容转换尤其困难,其中一个重要的影响因素是有的词汇在不同的学科有不同的含义。Nie-hoff等通过研制《能源兼容转换系统》,发现单个学科专业的词表自动转换效果较好,特别是社会科学类的词表系统较易实现兼容转换[1]

(3)词汇因素

由于收词量、专指度、词条款目形式控制、入口词、表达精确度等各表都不一样,使不同词表的词汇兼容转换效果存在较大差异。相同或相近领域词表的转换效果很好。《医学主题词表》(MeSH)与《农业生物学词表》(Agricultural/Biological Vocabulary)的兼容率达76%,而《国会图书馆标题表》(LCSH)与《农业生物学词表》的转换率仅为11%。《汉表》是我国最大的、综合性最强的叙词表,社会科学部分收词约12万。关于《汉语主题词表》的专指度,有学者进行过标引实践与实验测试。实验结果表明,《汉语主题词表》完全有能力标引非常专业的文献,且应用于《航空科技资料主题表》、《机构工程主题词表》、《国防科技主题词表》等等[2]。《社科表》是目前我国最大的、综合性最强的专门用于社会科学文献标引和检索的专业词表,收词约2.3万个,词汇专指度较高。《经管表》是经济学管理学论文题录索引数据库的主题词库,具有坚实的文献保障基础,其专指度高于《汉表》和《社科表》。

(4)词表结构的兼容程度

一般说来,词表显示词汇的手段越多,则越容易实现转换。对词表兼容性影响较大的主要是词表的微观显示结构,即每一条叙词款目的构成。如果两表的显示结构越相似,数据处理就越容易,二者的兼容转换就越容易实现。从表2-1可以看出,《汉表》与《社科表》有着几乎完全相同的款目格式,《经管表》可看作一个没有参照项的叙词表,但它可以通过《汉表》和《社科表》提供的参照系统提高转换性能。

表2-1 《汉表》、《社科表》和《经管表》叙词款目参照系统

img6

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈