首页 > 编程知识 正文

数据分析师分析报告,阿里大数据查询

时间:2023-05-03 12:33:29 阅读:53486 作者:4353

在当今企业推进数字化的背景下,“No Data、No BB”成为职场人的口头禅。 编写良好的数据分析报告是能否帮助企业做出正确的业务决策以及能否说服上司获得业务资源的重要因素。

因此,编写高质量的数据分析报告是职场人的必备利器。

据说数据分析报告是不是将饼图、条形图、散点图的山登载在PPT上的。 阿里巴巴的工作需要编写数据分析报告。 我也积累了很多经验。 今天,我想从大家都很熟悉的这个操作中,看看有没有一成不变的路。

1 .表现主题决定了我们的图表形式

决定分析报告图表格式的不是所拥有的数据是什么,而是要表现的主题是什么。

图1和图2基于相同的数据显示了两个不同的图表。

在上图中,可以看到,对于相同的数据,根据我们想表达的主题的不同,会呈现出完全不同的表达方法。 图1显示了化妆水和沐浴露两个类别的城市销售额排行榜,图2主要显示了同一城市两个不同类别的销售额差异。

因此,在写分析报告之前,请仔细想想自己想表达的主题是什么。

进行完整的分析后,不要抵制展现给听众的冲动,而要集中于需要表达的主题。 因为那才是听众应该知道的信息。

为了找到我们分析的主题,我们需要知道分析报告的对象。 详细了解听众的背景和观点,想想听众是怎么看我们的。 内容上,想让听众知道什么,知道接下来会有什么行动。 理解听众和内容后,确认数据的表现形式,只显示能够支持主题的数据。

整个分析报告必须在三分钟内说清楚,每个报告都可以用一句话概括。

2 .不放弃“头衔”这个绝佳职位

有些图表的标题与猜谜相同。 例如,公司的销售趋势、分公司的销售分布情况。 图表的重点完全没有被指出,公司的销售趋势如何? 分公司的销售分布怎么样?

不要把我们需要强调的要点像秘密一样透露出来。 应该把它放在图表的开头,减少听众误解的可能性,把注意力集中在想强调的数据上。

如下图所示,这张图到底是为了表现全量贩金额没有明显增长吗? 还是为了表现2月销售额出现断崖式下跌? 还是为了表达其他什么主题? 请用标题明确地传达给听众。

3 .处理“成分对比”的关系

成分对比主要表现在对一个整体各部分的百分比对比上。 经常出现“份额”、“百分比”等词语。 成分的比较通常使用饼图显示。

使用饼图时建议使用6个以下部分。 如果有6个以上的部分,可以将剩下的部分分类为“其他”一项。 另外,由于习惯看数据时顺时针看数据,所以可以将最重要的部分定位在12点钟的位置,用对比度强的颜色突出显示。

饼图主要显示单个整体各部分的比例,需要比较两个整体成分时,重点考虑条形图(图3 )。 因为使用饼图(图4 ),读者的视线需要在不同的图表之间来回移动。

成分分析可能包含副成分分析,需要将整体的一部分再次作为整体进行分析。 在这种情况下,可以将饼图放在第一个位置,将百分比条形图放在后面。

尽量不要使用饼图。 饼图在整体中所占的比例通常在5%以下。 尽量不使用3D饼图和甜甜圈饼图。 请记住,图表是为了让我们的听众更好地理解我们的数据,而不是图表有多不同。

4 .处理"项目间对比"的关系

项目之间的对比主要是比较不同项目之间的情况。 经常出现“等级”和“大小”等词语。 项目之间的比较通常用条形图表示。

我们有必要仔细考虑条形图的顺序。 天然有序的话,人生阶段遵循宝宝、少年、青年、中年、老年等天然顺序。 但是,如果没有这样的天然顺序,就需要考虑哪个顺序对我们的数据主题最有意义。

根据我们想强调的主题,选择条形图的排序方法。 条形图的数值显示方法包括刻度和在条形图中显示数字,您可以根据情况选择一个,但不要同时显示这两个。 图形更容易混乱。 同时显示数字时,去掉小数点以下的数值,3%总是比3.1415%更容易被听众记住。

关于项目间的对比有时也用条形图代替,但条形图与条形图相比有2点细目的优势

减少听众和时间序列的混淆

条形图中有很大的空间来填写各项目的名称

项目之间的对比还可以通过背离式条形图形象地分离有利和不利情况

也可以在项目之间比较范围。 在这种情况下,请使用范围条形图。

如果要比较的项目由多个部分组成,并且可以堆叠条形图,则最重要的元素必须靠近基线。 这是因为只有这一部分可以准确测量。

5 .处理"时间序列对比"的关系

时间序列

对比关心的是随时间变化的对比。常常出现“变化”、“增长”、“下降”等词汇。时间序列对比通常使用柱状图或折线图来展示,如果时间点不多时可以使用柱状图,如果时间点是很长一段时间范围使用折线图更为合适:

对于折线图,趋势线一定要比背景线粗。当存在同一张折线图存在多条折线时,需要将最关注的线加粗加亮。但是当出现非常多折线时,我们的折线图就会呈现出“方便面式”图表,往往导致图表混乱。如下图:

解决“方便面式”图表的方式可通过将折线图拆分到不同的小的折线图中,虽然图表变多了,但是所需要表达的主题也能更加清晰:

在时间序列对比中,可通过箭头、线条、阴影等方式强调数据的某一部分,将听众的注意力集中到你所期待关注的点上:

同样,时间序列对比也可以通过刻度的正负来区分正面情况和负面情况:

我们常常在时间序列中,可能包括实际值和预计值,可通过将实际值设置为实线,将预计值设置为虚线的方式:

当一个折线图的数值,是可通过一个公式生成的,可将公式中的计算因子分别拆分到计算树中,使听众可清晰看到每部分计算因子的变化情况:

如果只有两个时间点,可展现两组数据之间各维度的提升和降低的差异,形成斜率图,连接的线条可以直观的感受到提升与降低的程度:

不同的刻度基线会产出完全相反的数据主题解读。看以下2张图,同样都是对杭州房价的描述:

同样的数据,产出的图表给人截然不同的感觉。那么我们到底应该如何定义刻度呢。其实关键取决于我们对于变化的理解,100块钱对于房价来说可能微不足道,但是对于动车票价格可能就是至关重要。

我们应该选择一个刻度,能准确反映对变化重要性的理解。如果通过使用不合适的刻度基线来误导听众,只要有辨别能力的听众都能发现问题,那么我们的整套言论和信誉就会被唾弃。

6.处理“频率分布对比”的关系

频率分布对比表现的是数据分布范围情况。常常出现“范围”、“密度”、“分布”等词汇。频率分布对比通常使用柱状图或折线图来展示,当比较范围数量较多时可使用折线图,较少时可通过柱状图:

频率分布的范围大小非常重要,既不能太大也不能太小,建议5到20个分组。不同分组的大小应相同,否则会造成数据扭曲。

对于即需要展示频率分布,又需要进行项目间对比,可将分布柱状图进行组合,其中一个分布柱状图作为另一个的背景图:

7.处理“相关性对比”的关系

相关性对比表现的是不同变量之间的关系。常常出现“与XX有关”、“随XX增长”等词汇。相关性对比通常使用散点图或双条形图来展示。如下图:

在双条形图中,我们将独立变量按顺序排在左边,而把对比值放在右边,如果期望模式与实际模式一致时,右边的条形图就会变成左边的条形图的镜像,如下面左图。当关系不符合预期时,两组条形图则会发生偏离,如下面右图:

8.处理“多重对比”关系

对比可能不仅仅是一种对比关系,有可能是结合上文所说的成分、项目间、时间序列、频率分布、相关性对比中的一种或多种组合而成,我们称之为“多重对比”。例如“销售额在过去10年内稳步增长,但利润却没有同步增长”,这案例第一部分“销售额在过去10年内稳步增长”属于“时间序列对比”,第二部分“但利润却没有同步增长”属于项目间对比。对于这种情况,我们需要确定哪一种关系是主要的,哪一种是次要的。案例中,第一部分随时间变化是主要的,而销售额与利润项目间对比是次要的,因此最好选择以时间变化对比的折线图,并为每一个项目画一条支线的方式实现,如下图:

9.不仅仅只有图表

当然,对于数据分析报告,可定量信息我们可以通过图表构建,但是对于不可定量的信息,我们可以通过一些几何图形形成概念性视觉图像,或通过一些日常事务作视觉比喻。

例如说到目标,可以形成高山这样的视觉图像。这需要发挥自己的想象力,平时多留意写优秀的海报广告,在生活中寻找灵感,在报告中能够做到与听众产生共鸣的效果。

10.消除认知负荷

听众在接受我们分析报告信息时,需要消耗脑力去学习新知识,脑力是有限的,因此需要消除听众无关紧要的脑力消耗。造成无关紧要脑力消耗最大的问题就是“杂乱”,因此消除杂乱是数据分析报告需要重点关注的。

通过将文字从原来居中对齐调为左对齐,进行相关的无关数据的淡化的处理,能减少听众的认知负荷,把关注点转移到我们的重点上::

通过将网格线消除、标记点消除、金额度量转换、直接标记数据等手段降低认知负荷,右图是修改后的图表:

通过消除一些干扰,能突出我们所需要表达的重点。所有的数据不是相同重要,消除不需要关注的元素,或将不直接影响内容的元素融入背景。去掉这个东西会有什么变化?如果不会,那么就去掉吧。

同时要突出我们需要吸引听众实现的地方。在文字中可通过加粗、颜色、斜体、大小、空间隔离、下划线等手段突出文字关键词。

在图表中主要通过颜色、大小突出需要强调的内容。在使用颜色时需慎重选择,不能在一张图中有太多颜色,造成视觉干扰;可以使用颜色的不同饱和度来强调数据;根据分析报告背景,可选择对于的互补色来做内容的突出强调。

11.讲好分析报告

分析报告做好了,还需要以更好的语言表达方式呈现给听众。可以把分析报告当做一个故事来说,能更加引人入胜。

首先对整个背景做设定,接着介绍什么因素上下文驱动情节的演进,举例说明发生了什么样的冲突,基于这些冲突有哪些假设,再基于这些假设如何做数据验证,最后通过什么方式带来什么解决方案。

为了保证整个分析报告的逻辑清晰,可以构建类似金字塔的逻辑结构,以某一个中心论点为塔尖,在其以下分支出不同论点的数据分析支撑。让听众对我们的分析报告有个清晰的逻辑结构。

最后,希望每个职场人都能用数据分析报告打开一个新的天地。广阔数据天地,大有可为。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。