10.5.2 OLAP的多维数据结构与分析方法
一、OLAP的多维数据结构
多维数据模型是面向分析的数据模型,用于给分析人员多种观察的角度和面向分析的操作。下面介绍多维分析模型的基本概念。
变量:也称度量,是数据的实际意义。例如,数据“10000”本身并没有意义,它可能是一个学校的学生人数,也可能是某产品的单价。一般情况下,变量是一个数值的度量指标。如“人数”、“单价”等即是变量或度量。
维:维是人们观察数据的特定角度。例如,企业常常关心产品销售量随时间的变化情况,这时它是从时间的角度来观察产品销售,所以时间就是一个维(时间维)。企业也时常关心自己的产品在不同地区的销售分布情况,这时它是从地区分布的角度来观察产品的销售,所以地区也是一个维(地区维)。“维”是OLAP中十分重要的概念。
维的层次:人们观察数据的某个特定角度(即某个维)还可能存在细节程度不同的多个描述方面,我们称这多个描述方面为维的层次。例如:描述时间维时,可以从年、季、月、日等不同层次来描述,那么年、季、月、日等就是时间维的一种层次。
维成员:维的一个取值称为该维的一个维成员,也叫做维值。如果一个维的某种层次具有多个层,那么该维的维成员是不同维层的取值的组合。假设时间维的层次是年、月、日三个层,分别在年、月、日上各取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日”。一个维成员并不一定在每个维层上都要取值。对应一个度量数据来说,维成员是该度量数据在某个维中位置的描述。例如,对一个销售数据来说,时间维的维成员是该销售数据在时间维上位置的描述,表示是“某年某月某日”的销售数据。
多维数据模型的数据结构可以用这样一个多维数组来表示:(维1,维2,…,维n,度量值)。例如,如图10-17所示的电器商品销售数据是按时间、地区、电器商品种类,加上变量“销售额”组成的一个三维数组:(地区,时间,电器商品种类,销售额)。三维数组可以用一个立方体直观地来表示。一般来说,多维数组用多维立方体来表示,多维立方体也称为超立方体。
图10-17
二、OLAP的分析方法
OLAP分析主要是通过对以多维形式组织起来的数据进行切片、切块、钻取、旋转等基本动作,使最终用户能从多个角度、多侧面地观察数据仓库中的数据,从而了解数据背后蕴含的规律。下面介绍OLAP的分析动作。
切片:选取多维数据的一个二维子集的动作称为切片。例如选取多维数据(地区、时间、产品、销售额)中的地区维和产品维。而这时日维取值“2002年4月”,就得到一个二维切片,表示2002年4月各地区、各产品的销售情况。
切块:选取多维数据的一个三维子集的动作称为切块。可以把切块看做是在切片的基础上进一步确定各个维成员的区间得到的片段体,即把多个切片叠合起来。例如,选取多维数据(地区、时间、产品、销售额)中的地区维和产品维,而时间维取值为一个区间“2002 年1月至2002年4月”,就得到一个二维切块。
钻取:钻取有向上钻取和向下钻取操作。向下钻取是使用户在多层数据中能通过导航信息而获得更多的细节性数据,而向上钻取获得概括性数据。
旋转:旋转是改变一个报告或页面的显示方向。例如,把一个行维移到列维,或是把页面显示中一个维和页面外的维进行交换,便于用户按不同的维观察数据。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。