2.5.2 数据维度
“维”是指人们观察某个数据集合的特定角度,它是以对数据的某个共性的提取为前提的。同一个问题,可以从不同的维度(时间、地理、产品)进行观察分析。例如,连锁超市分析其在某一期间内营业额的变化情况时,可以从“时间维”的角度来分析问题。而按所处地区对每个连锁店的营业额进行分析时,观察问题的维就变成了“地理维”。同样,还可以从“单笔营业额”、“付款方式”等多个维来分析。
在同一个维度上,可以存在多个程度不同的细节,这些细节就是“维的层次”,它是对“维”的进一步细化。当人们从某个特定角度观察问题时,按所依据的细节程度(即维层次)的不同,可以得到多种描述方法。以商品零售分析为例,在时间维度上,可以按交易日、月、季度、年度等不同层次粒度上进行分析;在交易委托维度上,可以按更加细化的层次(如电话订货、网络订货等具体委托方式)进行分析。
“维成员”是指某个维的某个具体取值。如果该维具有多个层次,则维成员也是由在该维各层次上的取值组合而成的。例如,在交易量分析的时间维度上,有交易日、月、季度、年度共四个层次,如在每个层次上都指定了一个具体的数值,并将其组合起来,就得到了时间维的一个具体的维成员。
如果一个数据集合可以从多个角度进行观察,即具有多个维度,则根据这些维度将数据组织所构成的数组,就是多维数组。多维数组可以用(维1,维2,…,维n,变量)来表示。例如,在由“时间”、“地区”和“委托方式”组织起来的三维立方体中,加入“交易量”作为变量,就构成了多维数组(时间,地区,委托方式,交易量)。
数据维度就是相同类数据的集合。例如,某个连锁商业企业,他的连锁商店的集合,时间的集合,商品的集合可以构成一个三维的立方体结构,每个商店、每段时间、每种商品都是某一维的粒度。如图2-5所示,某商店的销售由特定的商店、某一给定时间段、指定商品组成。
图2-5 多维结构和维层次示例图
多维数据模型在数据仓库中的概念组织方式采用星形和雪花形结构模型,雪花形结构是星形结构的扩充。
例如,图2-6表示的就是销售分析的星形和雪花形数据模型。
在上述结构的基础上,需要进一步细化,增加定义实体属性,得到详细的数据模型,如图2-7所示,在图中也将指标实体“销售”称为“事实表”,维度实体称为“维表”,记录维的属性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。