首页 > 编程知识 正文

kimball建模过程,第三版维度建模的完全指南

时间:2023-05-06 16:31:04 阅读:271185 作者:1116

一致性维度

​ 当不同的维度表的属性具有相同列名和领域内容时,称维度表具有一致性。利用一致性维度属性与每个事实表关联,可将来自不同事实表的信息合并到同一报表中。

​ 维度建模的数据仓库中,有一个概念叫Conformed Dimension,中文一般翻译为“一致性维度”。一致性维度是Kimball的多维体系结构(MD)中的三个关键性概念之一,另两个是总线架构(Bus Architecture)和一致性事实(Conformed Fact)。

​ 在多维体系结构中,没有物理上的数据仓库,由物理上的数据集市组合成逻辑上的数据仓库。而且数据集市的建立是可以逐步完成的,最终组合在一起,成为一个数据仓库。如果分步建立数据集市的过程出现了问题,数据集市就会变成孤立的集市,不能组合成数据仓库,而一致性维度的提出正式为了解决这个问题。

​ 一致性维度的范围是总线架构中的维度,即可能会在多个数据集市中都存在的维度,这个范围的选取需要架构师来决定。一致性维度的内容和普通维度并没有本质上区别,都是经过数据清洗和整合后的结果。

​ 一致性维度建立的地点是多维体系结构的后台(Back Room),即数据准备区。在多维体系结构的数据仓库项目组内需要有专门的维度设计师,他的职责就是建立维度和维护维度的一致性。在后台建立好的维度同步复制到各个数据集市。这样所有数据集市的这部分维度都是完全相同的。建立新的数据集市时,需要在后台进行一致性维度处理,根据情况来决定是否新增和修改一致性维度,然后同步复制到各个数据集市。这是不同数据集市维度保持一致的要点。

​ 在同一个集市内,一致性维度的意思是两个维度如果有关系,要么就是完全一样的,要么就是一个维度在数学意义上是另一个维度的子集。例如,如果建立月维度话,月维度的各种描述必须与日期维度中的完全一致,最常用的做法就是在日期维度上建立视图生成月维度。这样月维度就可以是日期维度的子集,在后续钻取等操作时可以保持一致。如果维度表中的数据量较大,出于效率的考虑,应该建立物化视图或者实际的物理表。

​ 这样,维度保持一致后,事实就可以保存在各个数据集市中。虽然在物理上是独立的,但在逻辑上由一致性维度使所有的数据集市是联系在一起,随时可以进行交叉探察等操作,也就组成了数据仓库。

缩减维度 跨表钻取

​ 当每个查询的行头包含相同的一致性属性时,使不同的查询能够针对两个或多个事实表进行查询。

价值链

​ 价值链主要用于区分组织中主要业务过程的自然流程。如:销售商的价值链可能包括购进,库存,销售等。操作型源系统通常为价值链上的每个步骤建立事务或快照。因为每个过程在特定时间间隔,采用特定的粒度和维度建立唯一的度量,所以每个过程通常至少建立一个原子事实表。

企业数据仓库总线架构

​ 企业数据仓库总线架构提供一种建立企业DW/BI系统的增量式方法。总线架构中技术与数据库平台是独立的,无论是关系数据库或者是OLAP维度结构都能参与其中。

企业数据仓库总线矩阵

​ 用于设计并与企业数据仓库总线架构交互的基本工具。矩阵的行表示业务过程,列表示维度。矩阵中的点表示维度与给定的业务过程是否存在关联关系。需要考虑某一维度需要跨多个业务过程并保持一致性。

总线矩阵实现细节

​ 是一个更加粒度化的总线矩阵,其中扩展每个业务过程行以展示特定事实表或OLAP多维数据库。

机会/利益相关方矩阵

​ 在确定了企业数据仓库总线矩阵之后,可以通过替换包含业务功能(如市场、销售、财务等)的维度列规划不同的矩阵。通过确定矩阵点以表示哪些业务功能列与哪些业务过程行相关。机会/利益相关矩阵可用于区分哪些业务过程分组应该与过程中心行相关。(这块儿没读懂)

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。