2.4 数据立方体(Data Cube)

什么是数据立方体?估计朋友们应该在很多地方都听说过,或者实际开发中也有所涉及。数据立方体说白了就是我们可以从三个维度衡量和展示数据,比如时间、地区、产品构成三个维度的立方体。专业解释为:数据立方体允许多维对数据建模和观察,它由维和事实定义。

其实数据立方体只是对多维模型的一个形象的说法。从表方面看,数据立方体是三维的,但是多维模型不仅限于三维模型,可以组合更多的模型,比如四维、五维等等,比如我们根据时间、地域、产品和产品型号这四个维度,统计销售量等指标。

后面我们在介绍Apache Kylin的预计算多维指标时,即是生成Cube的过程,将所有的维度(dimensions)组合,dimensions的不同组合,在Apache Kylin中称为cuboid。比如包含n个dimensions的cube有2^n(2的n次方)个cuboid。