首页 理论教育 自动构建叙词表

自动构建叙词表

时间:2023-02-27 理论教育 版权反馈
【摘要】:2.2.3 自动构建叙词表如上所述,计算机辅助编制词表虽然提高了编表效率和词表的质量,但未涉及词汇控制的核心——词间关系的识别。为了适应联机和网络检索的需要,自动构建的叙词表在结构和词汇组织方式上与传统叙词表存在很大差别,类似于Roget型叙词表,且大多用于检索,只有少数同时用于标引文献。
自动构建叙词表_自然语言叙词表自动构建研究

2.2.3 自动构建叙词表

如上所述,计算机辅助编制词表虽然提高了编表效率和词表的质量,但未涉及词汇控制的核心——词间关系的识别。其实,早在20世纪70年代,信息检索专家就已开始探索自动构建词间关系的方法。美国学者Salton在1974年提出自动构建词表的设想,以词汇同现为依据,假设在某一主题领域的文献中语词同现的频率越高,这些语词的含义相关的可能性越大。从显示每个词对同现强度的语词—语词矩阵中,可以生成各种类型的聚类,如词团、词串、词星、词束[17]。1983年,他与学者McGill实践了这一想法,从工程文献库中自动抽词编成叙词表,并在其著作《现代情报检索导论》中提供了该词表的实例。后来,一批学者进行了大量研究和试验,尝试多种途径自动构建叙词表,如从用户检索式中提取词间关系、通过语法分析等语言学知识获取词间关系、从现有语义词典构建词表等,但探讨和应用最多的方法当属同现分析方法。

为了适应联机和网络检索的需要,自动构建的叙词表在结构和词汇组织方式上与传统叙词表存在很大差别,类似于Roget型叙词表,且大多用于检索,只有少数同时用于标引文献。不过,不管计算机生成的叙词表与人工编制的叙词表有多么大的差别,如果在全自动化的系统中,它可以明显改善检索性能,那么它就是值得采用的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈