(1)呈现现状的描述性统计(power pivot :pp ),通过对比与细分进行现状及原因分析。可制作数据透视表,通过求和、求均值以及数据组成了解其构成,还可通过不同时间维度的对比,查找数据变化原因,最后制作相关图表对现状进行呈现及描述。
(2)展望未来的预测性分析,分析现有数据间的相关性,探寻数据之间存在的联系,并进一步建立相关回归模型(分析工具库)的方式对未来进行预测。
2、power pivot:整合多数据源、处理海量数据、操作界面简洁、实现信息共享 三个数据处理分析工具优劣势对比 工具优点缺点Access数据库数据处理能力较强
使用SQL处理数据较为灵活
适合SQL初学者学习SQL语句
数据超千万条时性能会下降
使用SQL分析数据不如透视表灵活
Miscrosoft适合SQL初学者学习SQL语句数据处理性能弱于AccessPowerPivot可处理大型数据集
可用数据透视表灵活分析数据
数据处理灵活性低 用户购买行为分析框架(5W2H分析法 ) WHY用户购买目的是什么?-------- 市场调查获取数据WHAT用户主要购买的产品?-------- 各产品销量分布WHO用户有什么特征?------那女比例、年龄分布、地域分布、学历分布、收入分布、注册时间分布WHEN用户何时购买?---- 购买时间分布
多久再次购买?---- 购买间隔分布
WHERE用户购买渠道有哪些?---- 渠道销量分布HOW用户购买支付方式?---- 购买支付方式分布HOW MUCH用户购买什么价位段的产品?---- 价格段分布
用户再次购买意愿如何?---- 用户购买频次分布
峰度系数:描述对称分布曲线峰顶尖峭程度的指标,相对正态分布而言
偏度系数:以正态分布为标准来描述数据对称性的指标。
偏度系数越接近于0,偏斜程度就越低。
峰度系数>0两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布偏度系数=0分布对称偏度系数<0(ysdwt左移)长尾在右,正偏态分布 偏度系数>0(ysdwt右移)长尾在左,负偏态分布峰度系数<0两侧极端数据较少,比正态分布更矮更胖,呈平阔峰分布|偏度系数|>1高度偏态分布0.5<|偏度系数|<1中等偏态分布