首页 理论教育 数据的标准化处理技术

数据的标准化处理技术

时间:2023-02-27 理论教育 版权反馈
【摘要】:2.2.4 数据的标准化处理技术对于关系矩阵中的原始数据,从目前的研究情况看,有学者对其进行了标准化处理,有学者则主张直接采用原始数据。进行标准化处理一般采用皮尔逊相关系数法或Cosine法等。但在采用皮尔逊相关系数法时,由于SPSS软件的限制,数据量不能超过256对。
数据的标准化处理技术_基于引文分析可视化的知识图谱构建研究

2.2.4 数据的标准化处理技术

对于关系矩阵中的原始数据,从目前的研究情况看,有学者对其进行了标准化处理,有学者则主张直接采用原始数据。进行标准化处理一般采用皮尔逊相关系数法或Cosine法等。例如Small在其早期论述文献同被引的文献中采用了Jaccard系数测度和余弦测度[15][16];而由Howard D.White开创的传统的著者同被引分析中,则采用了皮尔逊相关系数法,借助于SPSS的功能把原始同被引频次矩阵转换成了相关系数矩阵[17]。但在采用皮尔逊相关系数法时,由于SPSS软件的限制,数据量不能超过256对。随着可视化算法和软件的开发,有学者开始采用原始数据,并获得了良好的效果。Howard D.White在2003年[18]采用与1998年相同的数据对情报科学著者重新作的同被引分析中就是采用了原始同被引频次。而Noel Steven[19]等把采用原始同被引频次和经过皮尔逊相关系数转换最后所得的图进行比较后认为,经过转换后那些同被引次数高的元素(文献或著者)和同被引次数低的元素(文献或著者)的差别减少,显示在图上的结果就是未经转换时居于中心的核心元素(文献或著者)在转换后其核心地位不再明显。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈