我们要的不是数据,而是数据告诉我们的事实。 许多人认识到数据可视化的必要性,但也面临着缺乏数据可视化专业知识的挑战。 原因之一是数据可视化是数据分析过程的一部分,数据分析师可能会致力于数据的获取、数据的清洗整理、数据的分析、模型的建立,但并不致力于最终的演示交流
这也是“写代码比不上PPT”的部分原因。 其实,如果掌握了可视化的技能,我们的工作就容易得到leader的认可。
可视化工具包括但不限于Tableau、Excel、PowerBI、Python和r
可视化前:探索性分析和描述性分析
两者之间有重要的区别。 探索性分析是指了解数据,找到值得他人分析或共享的精华。 这就像在牡蛎中寻找珍珠一样,打开100个牡蛎(尝试了各种方法),你也许终于找到两个珍珠。 根据说明,我们渴望能讲述一个故事——聚焦于两颗珍珠的东西。
大多数情况下,我们的报告工作是做解释分析工作。
可视化过程
完整的数据可视化过程,由以下四个步骤组成:
确定数据可视化主题
提取可视化主题的数据
根据数据关系决定图表
使布局和设计可视化
图: cjdpw居士
可视化要素由三个部分构成。 可视化空间标记视觉通道
可视化空间
数据可视化的显示空间通常是二维的。 三维物体的可视化通过图形绘制技术,解决了3D环状图、3D地图等二维平面上显示的问题。
标记
标记是数据属性到表示数据属性分类的可视化几何图形元素的映射。
根据空间自由度的不同,标记分为点、线、面、体,分别具有零自由度、1维、2维、3维自由度。 如我们常见的散点图、折线图、矩形树图、三维条形图,分别采用了点、线、面、体四种标记。
视觉频道
数据属性的值和标签的视觉表示参数的映射称为视觉通道,通常用于显示数据属性的定量信息。
常用的视觉信道包括标记的位置、大小(长度、面积、体积)。形状(三角形、圆、立方体。方向、颜色(色调、饱和度、亮度、透明度。 等等。
确定图表
数据之间的相互关系决定了可以采用的图表类型。 一般的数据关系和图表类型的对应关系如下图所示。
图: cjdpw居士
在今后的专栏中,我们将逐步分享以上图像中每个图形的应用案例和注意事项。 接下来,结合具体例子说明数据可视化的魅力
表格
使用表单时,请记住将设计纳入背景,并将数据置于中心地位。 不要让厚重的边框和阴影争夺数据和参与者的注意力。 而是使用空格来区分表格中的元素。
左边的表格,边框太多容易分散读者的注意力。 相反,三线表简明扼要,通常是论文和出版物表格风格的首选。
热血沸腾
热图是将数据以表格形式可视化的方法之一,利用在表示数据的地方(与数据不同)着色的单元传达数据的相对大小的信息。
热图(excel2010版) (数据(开始)样式) )选择条件格式(可以根据需要选择合适的条件格式)。
折线图
通常,可以使用折扣图表来理解趋势。 例如,按时间顺序的年降雨量(每天加量); 在某些情况下,折线图中的线条可能表示综合统计数据,例如平均值和预期点估计。 如果还想展示范围(或置信区间),可以在图中直接可视化。
左图是多指标折线图,右图是折线图中范围内的平均值。
绘制右图时:绘制avg--max折线图,单击鼠标右键,然后选择“更改图表类型”、“面积图”;
右键单击“选择数据”,添加最小折线图; 最后,选择最小折扣图,右键单击数据序列格式,然后选择实心--白色。
(文章来源: 51cto )
通报/反馈