首页 理论教育 文献与知识单元之间的密切关系

文献与知识单元之间的密切关系

时间:2023-03-04 理论教育 版权反馈
【摘要】:我们以布氏定律为参照系,采用区域分析和图形模拟对采自大型科学数据库的4组数据进行了实证研究,发现科学情报在文献层次和内容层次上更趋分散。而且,无论是采用区域分析,还是采用图形模拟来描述文献单元和知识单元的分布,两者之间基本上遵循同样的规律。本项研究还较为精确验证了齐夫定律对大型科学数据库中词集合的适应性和正确性。本项成果对情报学的理论和实践都具有重大意义。

11.1.4 结果和意义

我们以布氏定律为参照系,采用区域分析和图形模拟对采自大型科学数据库的4组数据进行了实证研究,发现科学情报在文献层次和内容层次上更趋分散。

而且,无论是采用区域分析,还是采用图形模拟来描述文献单元和知识单元的分布,两者之间基本上遵循同样的规律。从区域分析的结果来看,若各区载文量相等,则各区的词总数、词个数也基本相等,核心词则随区域递减,这更显示出科学情报在微观上的离散分布特征和规律;从图像模型的结果来看,载文量、词总数、词个数和核心词的分布方程完全相同,即符合Logistic模型,且其精确度远比莱姆库勒公式高。这从另外一个角度说明了文献与知识单元之间的密切关系。文献是知识的载体,知识单元的分布规律首先会服从文献单元分布的总趋势,在这个总趋势内再显示自身特有的一些规律。这一发现具有十分重要的意义,因为人们至今尚未找到度量语义情报或信息的完善方法,这就使得情报计量学不得不始终将文献作为离不开的对象,并使得情报计量学研究在实施过程中面临很多实际的困难。而本研究发现文献单元的离散分布遵循与知识单元一致的规律,这便可以使情报计量学家在研究时,能够通过文献单元的分布离散规律来“模拟”知识单元的离散分布规律,为情报计量学开辟了一条新的研究路线。

本项研究还较为精确验证了齐夫定律对大型科学数据库中词集合的适应性和正确性。尤其满足朱斯的双参数分布定律。无论是词种类数庞大而各级词频次较少的INSPEC数据,还是词种类少而频次相对较高的Biosis和Compendex数据,其主题词或关键词的分布均呈齐夫模式,这充分说明,齐夫定律不仅可以用来描述自然语言词汇的分布规律,也可以揭示文献中内容单元的分布规律,亦即情报、知识和信息的分布规律。证明了情报学基本定律的普遍适用性。

本项成果对情报学的理论和实践都具有重大意义。既然科学情报在文献层次和内容层次上具有相同的分布规律,在还没有解决语义情报或信息计量时,使得我们可以用文献计量来代替情报或信息计量,处理一些难以解决的问题。同时更为重要的是,我们揭示了科学情报在内容层次上的分布规律。这意味着离散分布是情报知识和信息的基本属性,也是情报学的基本规律。

需要指出的是,有可能影响本项目研究结论的是数据来源。我们用以表征知识单元的主题词或关键词在这三个数据库中均是相应于每篇文献出现的,是一种静态的、表面的联系,并不能表达知识的内在逻辑关系,因而抽取的主题词或关键词数量基本上与文献量对应,其分布显示出相同的规律是必然的,唯一例外的是核心词的分布。如果说一般的主题词或关键词尚不能完全代表一个学科领域的知识单元或内容单元的话,那么核心词则无疑是一个学科领域最基本的概念,最能反映该学科领域的基本内容和实质。核心词的分布也表现出与文献单元同样的规律,不同的仅仅是其离散程度更大。今后的研究需要在此基础上进一步考虑知识单元之间的内在逻辑联系,可以用引文索引、关系索引等手段建立这种联系,从科学情报的生产和利用过程中去考察其离散分布,这可能是研究科学情报离散分布最好的途径和方法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈