首页 理论教育 基于粗糙集的情报检索语言转换

基于粗糙集的情报检索语言转换

时间:2023-02-27 理论教育 版权反馈
【摘要】:第5章 基于粗糙集的情报检索语言转换近年来,国外一些大型研究项目开始研究检索语言的自动兼容转换方法,比如MACS和CARMEN。“交叉转换”不仅需要索引专家和相关学科领域专家的共同参与,而且需要花费大量的时间。一些基于统计的相似度度量方法和人工智能算法已经用于创建不同检索语言概念之间的兼容转换关系。研究表明,基于统计的方法不仅操作简单、需要资源少,而且非常有效,可以补充甚至替代“交叉转换”[4]。
基于粗糙集的情报检索语言转换_情报检索语言的兼容转换

第5章 基于粗糙集的情报检索语言转换

近年来,国外一些大型研究项目开始研究检索语言(包括本体)的自动兼容转换方法,比如MACS(Multilingual Access to Subjects)和CARMEN(Content Analysis,Retrieval and MetaData:Effective Networking)。Krause将人工创建的不对称双向语义匹配称作“交叉转换”(Cross-concordance)。“交叉转换”不仅需要索引专家和相关学科领域专家的共同参与,而且需要花费大量的时间。如果文献数据库采用的不是受控语言标引,而是自然语言标引(如关键词),那么“交叉转换”的创建就非常困难。因此,人们开始研究更有效的、能够实现检索语言兼容转换的自动方法[1]

如果有足够的文献已经同时用多种检索语言标引,即存在一定规模的并行文献数据库,那么不同检索语言的概念转换关系就可以自动近似地度量[2]。一些基于统计的相似度度量方法和人工智能算法已经用于创建不同检索语言概念之间的兼容转换关系。例如,CARMEN和ViBSoz应用条件概率建立了两种叙词表的概念双向转换关系,应用神经网络建立叙词表和关键词之间的转换关系[1]。Goetz用最大似然法建立了LCSH标题和DDC分类号之间的匹配关系[3]。研究表明,基于统计的方法不仅操作简单、需要资源少,而且非常有效,可以补充甚至替代“交叉转换”[4]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈