首页 > 编程知识 正文

数据分析建模方法,建模的基本步骤

时间:2023-05-03 16:05:54 阅读:58917 作者:4631

数据建模

世界上有千万种物品,各种各样的信息层出不穷。 每个信息都有自己的格式和表示方法,如何描述信息,以一定的方式进行转换,形成适合存储的数据格式称为建模。 常用的有实体建模法、维度建模法、范式建模法三种数据建模方法,两种数据建模方法都是信息结构清晰、pgddgs和读数。

(1)实体建模法

实体是现实世界中存在的或发生的事件,是现实世界中存在的可识别的、可区分的。 实体无论是人还是物,都可能发生了像篮球比赛这样的事情。 每个实体都必须具有区分各个实体的特性。 这些特性称为属性,每个实体可以由几个属性表示,每个属性都有值类型和范围。 属性是变量,值的范围是属性的值域。 实体建模法是根据客观世界中一个个实体与实体之间的关系,在数据建模过程中引入这一区分方法,将整个业务划分为一个个实体建立数据模型。 实体建模可以比较容易地实现模型的划分,抽象出具体的业务概念,建立符合自己需求的数据库模型。 由于实体建模是对客观世界的抽象,因此用这种方法创建的模型有一定的限制,适合特定领域。

)2)维度建模法

维度是数学上独立参数的数据,在数据分析领域是描述事物的角度和侧面,是数据库中描述某种事物的方法和属性的数量。 维度建模是对给定事物,用不同的描述方法记录该事物不同分类方法中各属性的值。 对人进行维度建模时,按性别维度分为男性和女性,按年龄段分为儿童、少年、青年、中年、老年,按收入水平分为3000以下、3000-6000、6000-3000、10000以上等集中类别

维度建模法的优点是,对某些东西,可以在各维度进行预处理,进行统计、分类、排序等,提高数据库的可操作性。 另外,用维度建模法建立的数据模型直观,能够紧密围绕业务需求建立模型,直观地应对业务中的问题。 建模方法简单,不需要进行特殊的抽象处理。 但是,维度建模法也有缺点。 一种是数据建模时需要预处理,存在很多预处理工作。 此外,如果业务需求发生变化,则必须重新定义维,然后重新对新维进行数据预处理。 在数据预处理过程中,许多数据往往是冗馀的,而且在维建模时只对维进行建模不能保证数据源的正确性和一致性,不适合在数据库基础上使用。

)3)范式转换法

范式是一种规则,是符合一定层次关系模式的集合,建立数据库时必须遵循一定的规则。 关系数据库中的关系必须满足一定的规则,也就是不同的范式。

范式建模法将原始数据信息在一定的数据结构和转换模型的基础上,转换为分解、规范的格式,使数据遵守一定的约束条件,每个数据项表示的含义明确,不产生歧义,同时各数据之间相互独立,依赖关系

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。