5.2.1 VisDLKC的功能建模
VisDLKC的功能组成如图5-5所示,主要包括四个模块:知识获取、知识融合、知识吸收以及知识提取。知识获取是从中国期刊全文数据库中获取文献资源,构建原型系统本身的资源库,主要功能包括文档管理、格式转换及自动标引;知识融合是以VisDLKC的资源库为数据源,按照一定的挖掘算法和展示算法自动构建领域概念图;知识吸收是用户使用VisDLKC提供的知识检索界面和知识导航工具收集需要的文献资源,同时利用概念图绘制工具协作完成资源的个性化组织和知识建构;知识提取是利用在线讨论工具和概念图绘制工具,实现用户之间的互动,协作构建概念图。四个模块中,知识获取模块是VisDLKC系统的基础,形成文献资源库;其他三个模块,按照知识融合到知识吸收再到知识提取的顺序依次进行,知识融合模块通过发现资源库中潜在的模式用以知识导航,知识吸收完成后再进行知识提取以得到更多知识。
图5-5 VisDLKC的功能组成
5.2.1.1 知识获取流程
知识获取流程如图5-6所示,通过半自动化方式完成,图中带蓝色填充的两个处理过程题录功能和全文下载是中国期刊全文数据库检索平台提供的两项功能,通过题录功能可以获取结果列表中所有文献的元数据内容,元数据内容可以直接下载保存为TXT文档;通过全文下载功能可以获取相关文献的PDF格式全文文档,需要手工操作完成。
图5-6 VisDLKC知识获取流程图
通过全文下载功能得到的PDF文档直接由操作系统的文件管理系统负责管理,文档管理处理过程则完成所有PDF文档的路径管理,便于用户存取相关的PDF文档。为了便于统一处理和快速标引,需要将题录功能下载得到的TXT文档转换成结构化的XML文档;然后,通过自动标引处理过程批量地将XML文档索引到知识库之中。知识获取实现的关键是格式转换算法和自动标引处理的确定,标引是检索的基础,标引文献的数量决定了用户能够从VisDLKC中检索得到文献资源数量。
5.2.1.2 知识融合流程
VisDLKC中可视化技术对知识融合的支撑以概念图自动构建为例,其处理流程如图5-7所示。
图5-7 VisDLKC知识融合流程图
处理流程包括五个步骤:一是数据准备,按照一定的规则选择可以作为构建领域概念图的数据源。例如选取标题或关键词中还有某一主题词的相关文献,或者选取某一领域相关专业期刊近十年的文献,数据准备就是选择满足需要的文献集合;二是概念选择,按照一定的规则从上述文献集合中选取领域概念图中的概念列表,可以将每篇文献的所有关键词组成的集合作为概念列表,可以选取其中的高频关键词组成的集合作为概念列表,也可以将标题、摘要中的自由词甚至全文中的高频词作为概念来源;三是强度计算,是根据一定的假设确定概念列表中概念之间的关联强度,关联强度可以按照两个词在同一篇文献中共现的频率确定,共现频率越高,表明两个概念之间的关联性越强,强调计算将生成概念列表中所有概念及两两之间关联强度构成的关系矩阵;四是关系挖掘,是按照一定的挖掘算法从关系矩阵中生成关联矩阵,即根据两个概念之间的关联强度以及这一关联强度在所有关系矩阵中的位置情况确定它们之间的关联是否足够强,达到一定程度则在二者之间建立一条连线,生成的关联矩阵以XML文档格式描述以满足多种可视化展示的需要;五是图形展示,利用一定的图形展示工具将概念图动态直观地展示出来。
5.2.1.3 知识吸收流程
知识吸收流程如图5-8所示,用户一方面使用系统提供的知识导航工具收集需要知识资源,另一方面利用概念图绘制工具协作完成知识的建构。
图5-8 VisDLKC知识吸收流程图
知识导航工具包括三个来源:一是根据检索请求系统返回的结果列表,通过知识检索功能直接实现;二是根据结果列表生成的时间统计图,用以反映结果列表中文献在时间上的分布规律,便于用户确定检索课题在时间序列上的分布以发现研究热点,通过时间统计功能实现;三是由可视化算法生成的关键词网络和关键词分布图,用以揭示结果列表中所有文献的全部关键词之间的关系以及它们在文献集合中的分布规律,便于扩展查询请求以及让用户确定检索课题在内容分布上的规律以更为准确地定位所需文献资源,关键词网络和关键词分布通过分析结果列表生成相关模式并通过图形展示得以实现。知识导航为用户获取相关的文献资源提供了方便的通道,而知识吸收的完成关键还在于知识建构的实现。用户获取所需的文献后,利用概念图绘制工具辅助学习和理解相关的知识。学习的一般流程是首先确定学习目标并收集相关的文献;接着,逐篇浏览检索得到的相关文献建立初步的框架体系;然后,确定一定的主题进行专题学习,构建相关专题的概念图;最后,系统学习相关专题,完成知识的整体建构达到学习目标。知识导航的使用和概念图绘制在时间上不是线性的,概念图绘制过程中依然可以使用知识导航工具收集相关文献;同时,概念图绘制工具应提供组织相关文献的导航功能,以实现利用用户的知识结构组织相关资源。
5.2.1.4 知识提取流程
知识提取则通过在线讨论协作完成领域概念图的绘制,其流程如图5-9所示。
图5-9 VisDLKC知识提取流程图
概念图是知识表示的重要工具,利用概念图提取知识可以促进用户进行讨论、得到更多的概念以及概念之间的关系。概念图绘制工具应提供丰富简易的操作便于用户绘图、同时支持多人协作制图。概念图管理功能负责实现概念图文件的添加、修改、删除及提交操作,用户协作完成概念图的绘制后应提交系统保存,以用于支持后续用户的学习过程。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。