首页 > 编程知识 正文

实施工程师sql笔试题,数据分析面试题

时间:2023-05-03 05:33:05 阅读:173241 作者:3294

文章目录1 .请介绍数据建模相关项目2 .工作中常用的建模工具是什么? 3 .数据库三范式4 .对概念、逻辑、物理建模的理解5 .模型设计有几步? 6 .有哪些模型设计方法? 7 .维度模型分为几类? 8 .维度模型中表的分类9 .如何确定哪些表是增量表,哪些表是全量表? 10 .你们的模式是怎么分层的? 为什么? 11 .如何管理元数据? 12 .项目进行到一半,需要增加一个维度吗? 13 .建模结束后,如果发现某个事实表很巨大怎么办? 14 .如何做好数据质量管理?

前言:最近公司又要招聘数据建模工程师,所以我也负责建模工程师的技术方面。 总结了数据建模的面试问题。 如果有错误,欢迎交流。

啊啊,打杂的命本职工作没有进展的话,每天都会打杂。

1 .请介绍一下数据建模相关项目[你需要清楚自己做了什么]

2 .工作中常用的建模工具是什么? [基础问题,确认是否有实际使用经验]

powerdesigner、Balsamiq Mockups、ER/Studio、CA ERwin…

3 .数据库三范式[基础中的基础]

每个属性值都是唯一的,且没有多义性的每个非主键属性必须完全依赖于整个主键,而不是主键的一部分。 每个非主属性都不能依赖于其他关系的属性。 因为这样的话,那个属性就需要归属于其他关系。 4 .对概念、逻辑、物理建模的理解概念建模:推导实体逻辑建模:将实体细分为具体的表,同时将表结构3358www.Sina.com/满足业务需求物理建模:数据分析或前端展示的主题3358www.Sina.com/:确定主题后,必须考虑分析的技术指标。 一般来说,数据值类型数据3358www.Sina.com/:确定度量后,必须考虑与该度量的聚合情况不同的维度上的度量聚合情况确定主题:维度是分析的各个角度。 维级别(Hierarchy和级别) Level )确定度量)确定数值数据和维后,考虑加载数值表。 有什么样的模型设计方法? 3358www.Sina.com//主要解决关系数据库的数据存储,基于三范式http://www.Sina.com//事实表、维度表构建数据仓库7 .维度模型3358www.Sina.com/:核心是由一个事实表和多个非正规化记述的维表构成的确定事实数据粒度:星型模型的扩展,不同的是维表被正规化,进而分解为追加表3358 www.Sina.com :由多个事实表组合而成的星座模型是数据仓库中最常用的模型8 .维度模型中的表的分类确定维度:主要是用户、商家、商品创建事实表: 状态分类http://www.Sina.com//状态变化,也称为订购状态、支付方式、批准状态,即使生成周期型事实表http://www.Sina.com//数据也不变化,与事务型事实表9 如何判断哪个表是增量表,哪个表是满刻度? 实体表和维度表统称为维度表,可以定期按全部ETL周期]进行

事务事实表,可每日增量按ETL周期]

可以做周期性的事务表、拉链表

10 .你们的模式是怎么分层的? 为什么? [只要言之有理就好]

3358www.Sina.com/:保存原始数据,结构清晰,经范式/关系建模:ETL处理,数据更规范,http://www.Sina.com/:大确保及时备份元数据[至少每天]

12 .项目进行到一半,需要增加一个维度吗? 5 )分析新维度)分析新维度与现有维度的关系) 13 .建模结束后,发现某个事实表巨大怎么办? 哈希、数据倾斜处理零散…

14 .如何进行数据质量管理? 元数据管理、数据完整性、数据完整性、数据合规性、数据冗余、数据资产排名.

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。