首页 > 编程知识 正文

python excel表格处理,python处理excel数据教程

时间:2023-05-06 02:57:26 阅读:265479 作者:3047

利用pandas高效处理数据。

pandas依赖xlrd模块来处理Excel。安装这个模块:pip install xlrd安装pandas,安装命令:pip install pandas

pandas处理Excel表单
提前准备一个Excel文件:dataFall2018.xlsx,有一个表单,表单名为Sheet1;
Sheet1的数据展示如下:

引入pandas模块:

import pandas as pd

读取Excel的两种方式:

默认读取第一个表单: import pandas as pddf = pd.read_excel('dataFall2018.xlsx')#默认读取前五行的数据data = df.head()print("获取到的数据:n",data)

结果如下

2.通过指定表单名来读取:

import pandas as pddf = pd.read_excel('dataFall2018.xlsx',sheet_name='Sheet1')data = df.head()print("获取到的数据:n",data)

结果和第一次一样。

3.通过表单索引来指定要访问的表单,0表示第一个表单;也可以采用表单名加索引的方式来定位表单;也可以同时定位多个表单。

df=pd.read_excel('dataFall2018.xlsx',sheet_name=['Sheet1','Sheet2'])#可以通过表单名同时指定多个# df=pd.read_excel(''dataFall2018.xlsx',sheet_name=0)#可以通过表单索引来指定读取的表单# df=pd.read_excel(''dataFall2018.xlsx',sheet_name=['Sheet1',1])#可以混合的方式来指定# df=pd.read_excel(''dataFall2018.xlsx',sheet_name=[1,2])#可以通过索引 同时指定多个data=df.values#获取所有的数据,注意这里不能用head()方法哦~print("获取到所有的值:".data)

pandas操作Excel的行列

读取指定的行,数据会保存在列表里面 import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')#0表示第一行 这里读取数据并不包含表头,要注意哦!data = df.ix[0].valuesprint("获取到的数据:n",data)

结果如下

2.读取指定的多行,结果会保存在嵌套列表里面

import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')#0表示第一行 这里读取数据并不包含表头,要注意哦!data = df.ix[[0,1]].valuesprint("获取到的数据:n",data)

结果如下(空数据会被nan代替):

读取指定的行列: import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')#读取第0行第1列的值data = df.ix[0,1]print("获取到的数据:n",data) 读取指定的多行多列值 import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')data=df.ix[[0,2],['喂料秤','窑速']].values#读取第一行第三行的喂料秤以及窑速列的值,这里需要嵌套列表print("读取指定行的数据:n{0}",data) 获取所有行的指定列 import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')data=df.ix[:,['喂料秤','窑速']].values#读所有行的喂料秤以及窑速列的值,这里需要嵌套列表print("读取指定行的数据:n",data) 获取行号并打印输出 #这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')print("输出行号列表",df.index.values)

结果显示如下:

获取列名并打印输出 #这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')print("输出列标题",df.columns.values) 获取随机输出指定行数的值: import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx' )print("输出值",df.sample(1).values) #这个方法类似于head()方法以及df.values方法 获取指定列的值 import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx' )print("输出值n",df['喂料秤'].values)

pandas处理Excel数据成为字典

import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')for i in df.index.values: #获取行号的索引,并对其进行遍历 # 根据i来获取每一行指定的数据,并利用to_dict方法转成字典 row_data = df.ix[i].to_dict() print(row_data)

参考 https://www.cnblogs.com/liulinghua90/p/9935642.html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。