读取并整合目录1、背景介绍2、目标达成1、订单1、订单2、订单3三个表,获取该餐饮店8月份的所有订单数据。 2、计算8月饮食每日销售额,绘制折线图分析8月饮食销售额趋势。 3、计算周一~周日的销售额,绘制条形图分析周一和销售额的情况。 4、绘制圆环图,分析星期和销售额的占有率。 5、绘制气泡图分析时间、订单量、销售额关系。 三、读取并组合数据预处理1、库导入2、数据合并3、表格字段获取4、目标实现1、订单1、订单2、订单3三个表格,获取该餐饮店8月份的所有订单数据。 2.8月饮食每日销售额计算,绘制折线图分析8月饮食销售额趋势。 3 .计算周一至周日的销售额,绘制条形图分析周一和销售额的情况。 4、绘制圆环图,分析星期和销售额的占有率。 5、绘制气泡图分析时间、订单量、销售额的关系。 五.总结
一、背景介绍某餐饮店8月份的订单数据分别保存在订单1、订单2、订单3三个表中,目前餐饮店经理想了解8月份该餐厅的销售额情况。
二、完成目标1、读取并合并订单1、订单2、订单3三个表,获取该餐饮店8月份所有订单数据。 2、计算8月饮食每日销售额,绘制折线图分析8月饮食销售额趋势。 3、计算周一~周日的销售额,绘制条形图分析周一和销售额的情况。 4、绘制圆环图,分析星期和销售额的占有率。 5、绘制气泡图分析时间、订单量、销售额关系。 三、数据预处理1 .导入库采用pandas库,分别读取三个表
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltorder1=open (order1. CSV ) ) order2=open (order2. CSV ) data1=PD.read_CSV(order1) data1=PD.read_CSV(order1) data3=PD.read_CSV ) order3)2.数据合并data=PD
3 .获取表单域#打印列标签data.columns
四、读取并合并目标订单1、订单2、订单3三个表,获取该餐饮店8月份所有订单数据。 importpandasaspdplt.rcparams [ ' font.sans-serif ' ]=[ ' simhei ' ] #中文标签order1=open(order1.CSV ' ) order2=
2.8月饮食每日销售额计算,绘制折线图分析8月饮食销售额趋势。 #销售数据[ ' price ' ]=data [ ' counts ' ] * data [ ' amounts ' ] data [ ' price ' ]
#将预约日期与星期对应的week=PD.datetime index (data [ ' place _ order _ time ' ] ) data [ ' weekday _ name ' ]=week.wekday
numpy库importnumpyasnpdata _ GB=data [ [ ' day ',' price ' ].group by [ by=' day ' ] # number.agg聚合日期和价格number=
绘制折线图
matplotlib.pyplot库importmatplotlib.pyplotasplt.figure (fig size=(10,7 ) #绘图窗口PLT.rcparams [ ' font.sans 32 ),number,设置marker=' d ' number ) PLT.title(2016年8月饮食销售额趋势图) (plt.xlabel ) (plt.ylabel ) )销售额(PLT.plabel )
3 .计算周一至周日的销售额,绘制条形图分析周一和销售额的情况。 importnumpyasnpdata _ GB=data [ ' weekday _ name ',' price ' ].group by [ by=' weekday _ name ' ] # number.agg
#星期的排序操作sort=['Monday '、' Tuesday '、' Wednesday '、' Thursday '、' Friday '、' Saturday '、' Sunday']outcome2=
画条形图
PLT.rcparams [ ' font.sans-serif ' ]=[ ' simhei ' ] PLT.bar [ range (1,len(outcome2) ],outcome2,width=out
4、绘制圆环图,分析星期和销售额的占有率。 画圆环图
importmatplotlib.pyplotasplt.figure (fig size=(5,5 ) ) PLT.rcparams [ ' font.sans-serif ' ]=[ ' simhei ' ] Lara
5、绘制气泡图分析时间、订单量、销售额的关系。 进行分组汇总
data_gb=data[['order_id ',' price ',' day']].groupby[by='day']#定义了sort函数,删除了表中的重复数字,然后单击源defsort(data ) :返回len (NP.unique ) data ) ) outcome3=data _ GB.agg ({ ' price ' 3360 NP.sum,' order_} )
创建气泡图
importmatplotlib.pyplotasplt.rcparams [ ' font.sans-serif ' ]=[ ' simhei ' ] PLT.figure (fig size=() 10,6 ) s=outcome3[ ' order _ id ' ] (订单量、销售额与时间之间的关系) (plt.xlabel ) (时间) (plt.ylabel ) (销售额) (plt.show )
五、总结本文主要采用Python的pandas库实现表格的读取和合并,用numpy库实现表格数据的分组,最后用matplotlib库对numpy处理的数据进行折线图、条形图、组合
数据集到云磁盘的链接:
链接: https://pan.Baidu.com/s/1t8k2reu B1 ciqiwbmu1xkza
引出代码: wlfn