3359 MP.weixin.QQ.com/MP/home page? _ _ biz=mzi0ndq5nzyxng==hid=9sn=5a57 D1 e 51692 be 40 c 713191 f 5958 f 909 # we chat _ redirect
33558 www.Sina.com/bi (business intelligence )是一种商业智能,它可以有效地集成企业中的现有数据(原始数据、业务数据、业务数据等),实现快速准确的记录
原始数据记录了企业的日常事务,包括与客户的往来、财务信息和员工关系记录。
这些数据可用于报告、分析、钻井、数据质量、相互作用、预测分析等
什么是BI?数据仓库是为查询和分析而设计的数据库,而不是事务。
数据仓库是通过整合各种异构数据源构建的。
数据仓库的存在使企业或组织能够将数据整合、分析和事务工作分离开来。
可以将数据转换和集成为更高质量的信息,以满足企业用户不同级别的需求。
什么是数据仓库ETL是Extract-Transform-Load的缩写,是从源系统提取数据、进行转换处理并加载到数据仓库中的完整过程。
让我们看看ETL流程的完整流程图。
ETLProcess.png
提取
提取有效数据
变换
将提取的数据转换为数据仓库模式/格式
构建keys:key是一个或多个数据属性的唯一标识实例,key的类型包括主键、外键、备用键和复合键这些密钥只允许数据仓库维护管理,不允许分配其他实体。
数据清理:提取数据后,转至数据清理的下一个节点。 识别提取出的数据中的错误并进行修复。 解决不同数据集之间的不兼容性冲突,确保数据的完整性,使数据集可供目标数据仓库使用。 转换系统的处理通常可以通过创建元数据(元数据)来解决源数据问题,并提高数据质量。
公路
将转换后的数据加载到数据仓库中
创建聚集:创建聚集以聚集数据并将其存储在表中。 这样可以提高最终用户的查询体验。