5.4.3 相关关系识别
相关关系是不同于等同关系和等级关系的某种比较密切的类缘关系。词表中的语词在概念上或语义上相关联,并且达到一定程度时,在词表中应予以明确。相关关系是提高查词效率,扩大检索范围,增加检索途径,进行相关信息查找的重要手段。相关关系范围广、种类多、灵活性大、很难严格界定。在传统词表编制时,编表专家只能依靠其常识和所掌握的学科知识判别相关关系,但对于明显具有相关关系的候选语词,它们之间的某种关系还是可以确定的。
(1)相关关系种类[13]
在财税词表中,相关关系主要涉及以下几种:
①近义词之间的关系。 如:税收饶让C减税。
②反对或矛盾关系。 如:通货膨胀C通货紧缩。
③交叉关系。 如:税收征管C纳税管理。
④应用关系。 如:税收C税收征管法。
⑤影响关系。 如:涉税违法行为C税收秩序。
⑥因果关系。 如:涉税违法行为C涉税违法案件。
(2)相关关系识别方法
所构建的关联概念空间已经起到聚集相关联的词汇的作用,与某语词相关联的词汇集合中包括了与之在概念或语义上相关和相似的词汇,所以可以直接用以推荐相关词汇。Lancaster FW也曾推荐过这种方法,从一个适当的数据库生成的词汇同现表,可以确定哪些词是“相关”的[3]。但是,这种方法聚集的相关词汇,可能包含了具有等同关系、等级关系的词汇,所以需通过程序过滤掉同义词和等级关系词,剩余的词汇可以按关联度从大到小推荐给编表人员,然后根据以上相关关系种类,可由人工进一步鉴别和确定内核表中需要收录和揭示的强相关词汇。如对于内核词汇“税收政策”,已经建立起来的等级关系如下:
①从关联概念空间中提取词汇“税收政策”最相关的前K(K=15)个词汇,并按关联度自大到小排列:
②从相关词汇列表中去除该词汇已有等同关系和等级关系的词,把剩余相关词汇推荐给用户;本例中,从关联词汇中,去除具有等级关系的词汇“政策”、“出口退税政策”二词。
③人工鉴别强相关词汇作为该词相关词,并把词间关系收入表中。
经人工判断,其中“税收优惠政策”和“税法”与“税收政策”属于近义词,“税收征管”和“税收”二词与“税收政策”具有影响关系,在确定词表有必要揭示这些关系后,可以收录作为参见参照关系。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。