首页 百科知识 数据关联定义与核心

数据关联定义与核心

时间:2023-07-05 百科知识 版权反馈
【摘要】:数据关联,或更大范围,我们称为全息数据关联与价值重构,是大数据的价值所在。大数据经济学研究的是海量数据如何形成有效价值关联的问题,基本前提是整个社会经济的解构与重构。研究大数据经济学的目的便在于从价值密度低的海量行业数据中挖掘出关联度高价值增加值大的海量数据。

数据关联,或更大范围,我们称为全息数据关联与价值重构,是大数据的价值所在。核心表现为交易成本从传统物质成本与传统管理成本等,转化为数据计算成本。

单条数据的价值是有限的,大数据的经济价值在于将海量数据中关联度较强的数据信息挖掘出来进行整理与分析,最主要的用途是为决策者提供决策信息参考与依据,同时为预测经济提供理论依据。

何为有关联价值的数据?应该有一个关联度的界定。如在数学相关性分析中相关系数在0.8以上的为强相关性,0.6~0.8的为偏强相关性,0.6~0.3的为偏弱相关性,0.3以下的为弱相关性。

在大数据时代,数学上相关性极低的数据,只要数量足够海量,足够全样本,那么它们汇集起来就会发生价值关联,产生价值。因此,大数据时代研究的是基于庞大数据库和庞大计算能力的数据相关关系,同时也是一个基于全局数据库(整个社会的离散化解构)的因果关系。

大数据经济学研究的是海量数据如何形成有效价值关联的问题,基本前提是整个社会经济的解构与重构。在这个基础上,只要具有相关性程度的数据即可产生价值,取决于我们挖掘其价值的途径与方法,或者说取决于价值取向。

一个重要的问题需要回答,具有关联价值的数据如何产生大数据的经济价值?这实质上需要具体阐述价值关联如何使价值爆炸式增值:因为单条数据并不具有外部性,多条以上数据便具有外部性,一旦到了全局数据库的层面,数据的用途外部性与成员外部性就异常凸显(参见《平台经济学》,上海交通大学出版社,2013年第二版)。

我们要找到实现数据之间的外部性连接点,并使其实现一加一大于二的价值。譬如国家电网智能电表的数据可以用于估计房屋空置率,淘宝销售数据可以用来判断经济走势。而这个连接点,就是本书第10章与第11章所论述的大数据平台。

以用户为中心,结合用户在不同系统留下的数据,充分利用个性化的数据挖掘技术,是实现通过数据交叉而产生巨大价值的最可行的途径之一。价值一旦产生较强关联性,我们便可以从“样本”预测出“全样本”信息,解决由于信息不对称带来的高昂的成本与费用,使原本模糊的、复杂的事物之间的关系清晰明了,从而产生巨大的经济价值。

研究大数据经济学的目的便在于从价值密度低的海量行业数据中挖掘出关联度高价值增加值大的海量数据。大数据要求数据能充分发挥其外部性并通过与某些相关数据交叉融合产生远大于简单加和的巨大价值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈