python echarts数据可视化python echarts数据可视化实战序语言云分析柱状图分析饼图分析总结
python echarts数据可视化实战引言
引言
前一章通过一个简单的例子说明了如何获取特定网页上大量的岗位数据并构建数据集。 如果有数据集,就可以进行将其可视化的指标分析。
我们在上一章爬取的就业岗位数据是存储在Excel中的罗列数据:
那么,不熟悉excel使用方法的学生可能面临着难题。 如何在不同的维度上可视化和分析这些数据,得到我们想要的结果呢? 别急,我们慢慢看吧。
可视化有各种各样的工具。 它们可以实现绚烂的可视化。 例如,市场上常见的echarts、tableau等。 对于日常工作中需要解决的可视化任务,有一两个这样的工具就足够了。 此处介绍了通过使用python附带的pyecharts包,不需要安装更多的可视化工具软件就可以轻松实现可视化的方法
云在分析了我们拥有大量的工作岗位数据之后,如何对这些工作岗位有最直观的认识呢? 云是个好办法。 “云”的概念是形成“关键词云”或“关键词渲染”,是互联网文本中频繁出现的“关键词”的视觉强调。 云地图可以过滤大量的文本信息,让浏览网页的人只要扫描文本就能知道文本的主旨。 下面,我们来看看如何将职场名称这个字段云可视化。 具体的python代码如下。
部署pyecharts相关包,部署构建云所需的软件包,并、 读取csv文件所需的pandas软件包frompyechartsimportoptionsasoptsfrompyecharts.chartsimportwordcloudfrompyecharts.globalsimportts 读取工作场所数据,不同工作场所名称的字数RES=PD.read_CSV(./test.CSV ) ) a_name=list(RES .工作场所信息. value_counts ).index ) aa a_count ) words=[ ] fori ina : words.append ) I )使用WordCloud词组模块以链式方式调用展开,最终生成html文件c=word _ sizzend
从图中可以看到,很多从事客服、销售、储备的岗位,我们爬的网站其实是经贸学校的就业网站,可以用语言来描绘的结果也符合经贸学校的定位。
使用柱状图分析职场信息时需要关注的指标之一是工资分布。 那么,我们来看看通过柱状图观察不同工资范围的分布情况的方法吧。 使用pyecharts将柱状图可视化的方法如下。
#所需的pyecharts软件包frompyechartsimportoptionsasoptsfrompyecharts.charts import * importpandasaspdres=PD.read _ CSV (./) TSV薪金频率统计信息x_index=list(RES .薪金. value_counts(.index ) y_value1=res .薪金. value_counts ).to_list )
从图中可以看出,工资区间4500-5499范围等的职场数量最多,有300个。
在饼图的分析中,根据单词的频率,可以分析出数据最多的职场是什么。 另外,可以从条形图中得到不同工资范围的工作岗位分布。 那么,如果你想看不同类别岗位的占有率,在上述两幅图中是不合适的。 饼图能很好地显示不同类别的占有率情况,直观,饼图给出了岗位占有率的实现代码。
#引入相关软件包frompyechartsimportoptionsasoptsfrompyecharts.chartsimportpage,Pieimport pandas as pd#读取数据,不同职位类别的test.CSV ' ) x_index=list ) RES .职位类别. value_counts ) )进行合并。y_value1=res .职位类别. value_counts ) ([list(z ) z ] forzinzip (x _ ) ) ) add,y_value1().set _ global _ opts (title _ opts=opts.title opts )
可以看出,销售顾客服务的比例最多。
本章使用pyeharts工具包来教您如何创建基本的可视化分析图表。 当然,这些都是可视化分析的开始,更复杂的场景和可视化还需要进一步深入探索。
感谢您的阅读。 如果您对博客内容的源代码感兴趣,或者希望继续获得大数据分析的一系列干燥知识,请在微信上搜索“高级数据分析师”或扫描以下二维码进行关注。 可以通过公众号的私信获得源代码信息。