5.4.1 一对一转换
在“一对一”转换中,数据库A和数据库B中每个不同的标引词都看作是一个等价关系,α定义为:
构建候选概念转换关系,并计算它们的依赖系数(见表5-2)。例如,在数据库A中有文献8和文献9使用SWD的标引词“迷信”。文献8和文献9在数据库B中的标引结果如下:
文献8:迷信;信仰;医药;超心理学;灵魂;法律;宗教;真理;科学
文献9:19世纪;20世纪;迷信;启迪;女巫;历史发展;巫术;超心理学
SWD中标引词“迷信”与IZ的标引词构建的候选概念转换关系如表5-2所示。可以看出,并不是所有候选概念转换关系都是正确的。根据信息检索理论,标引词的选词规则可以直接控制检索系统的性能。如果选择广义词作为标引词,那么查全率可以提高,查准率会降低;如果选择狭义词作为标引词,那么查准率会提高,查全率会降低。当相关文献量较大时,用户要求查准率越高越好。当相关文献很少时,用户要求查全率越高越好。因此,有必要规定不同类型语义关系对查准率影响的大小次序,即:
完全等同关系>狭义等同关系>广义等同关系>不完全等同关系
该次序表也是概念转换关系筛选的优先次序表。例如,对于源语言中的一个标引词,如果存在完全等同概念转换关系,那么其他的概念转换关系将被过滤掉。
表5-2 SWD—IZ的候选转换关系样例
续表 5-2
假设P为SWD中的一个标引词,IZ中有m个标引词(Q={Q1,Q2…Qm})和P的共现频率大于等于1。那么,筛选出的正式概念转换关系必须满足以下条件:
例如,迷信(SWD)→迷信(IZ)。以上筛选规则同样适用于“一对多”和“多对多”转换。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。