随着社会的进步,信息科技与通信技术的发展以及与此相关联的各类基础设施的完善,世界数据呈现爆炸式增长。2014年,国际数据咨询公司(International Data Corporation, IDC)公开表示,全球在过去几年新增的数据量是之前人类有史以来全部数据量的总和,并预计到2020年,全球产生的数据量总和将达到40 ZB(ZB,Zettabyte,十万亿亿字节)左右[1]。这些庞大数据中的绝大部分都是不精准且非结构化的,难以通过传统方式去处理,我们将这类数据称为大数据。大数据有4个主要特点,称作4V,即Volume:巨大数据量;Velocity:极性的处理速度;Variety:多结构化数据;Value:庞大的财富。大数据中蕴含的巨大潜能价值,引发了各行各业的关注。
近些年来,以Science和Nature为代表的一系列顶尖学术刊物,对大数据给予了极高的关注。各国政商界也对推动世界范围对大数据的重视起到了直接的作用,如我国国务院2015年8月颁布的《促进大数据发展行动纲要》,2012年3月美国白宫科技政策办公室发布的《大数据研究和发展计划》,法国政府2012年颁布的《数字化路线图》等政策文件。许多国家的政府和企业联合起来致力于推进大数据价值的开发,这一切都宣告着大数据时代的来临。
本章我们将重点描述MOOC数据的挖掘与分析。
【注释】
[1]Antony Adshead.Data Set to Grow 10-fold by 2020 as Internet of Things Takes off[EB/OL].[2014-04-09].http://www.computerweekly.com/news/2240217788/Data-set-to-grow-10-fold-by-2020-as-internet-of-things-takes-off.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。