利用pandas高效处理数据。
pandas依赖xlrd模块来处理Excel。安装这个模块:pip install xlrd安装pandas,安装命令:pip install pandaspandas处理Excel表单
提前准备一个Excel文件:dataFall2018.xlsx,有一个表单,表单名为Sheet1;
Sheet1的数据展示如下:
引入pandas模块:
读取Excel的两种方式:
默认读取第一个表单: import pandas as pddf = pd.read_excel('dataFall2018.xlsx')#默认读取前五行的数据data = df.head()print("获取到的数据:n",data)结果如下
2.通过指定表单名来读取:
import pandas as pddf = pd.read_excel('dataFall2018.xlsx',sheet_name='Sheet1')data = df.head()print("获取到的数据:n",data)结果和第一次一样。
3.通过表单索引来指定要访问的表单,0表示第一个表单;也可以采用表单名加索引的方式来定位表单;也可以同时定位多个表单。
df=pd.read_excel('dataFall2018.xlsx',sheet_name=['Sheet1','Sheet2'])#可以通过表单名同时指定多个# df=pd.read_excel(''dataFall2018.xlsx',sheet_name=0)#可以通过表单索引来指定读取的表单# df=pd.read_excel(''dataFall2018.xlsx',sheet_name=['Sheet1',1])#可以混合的方式来指定# df=pd.read_excel(''dataFall2018.xlsx',sheet_name=[1,2])#可以通过索引 同时指定多个data=df.values#获取所有的数据,注意这里不能用head()方法哦~print("获取到所有的值:".data)pandas操作Excel的行列
读取指定的行,数据会保存在列表里面 import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')#0表示第一行 这里读取数据并不包含表头,要注意哦!data = df.ix[0].valuesprint("获取到的数据:n",data)结果如下
2.读取指定的多行,结果会保存在嵌套列表里面
import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')#0表示第一行 这里读取数据并不包含表头,要注意哦!data = df.ix[[0,1]].valuesprint("获取到的数据:n",data)结果如下(空数据会被nan代替):
结果显示如下:
pandas处理Excel数据成为字典
import pandas as pd#这个会直接默认读取到这个Excel的第一个表单df = pd.read_excel('dataFall2018.xlsx')for i in df.index.values: #获取行号的索引,并对其进行遍历 # 根据i来获取每一行指定的数据,并利用to_dict方法转成字典 row_data = df.ix[i].to_dict() print(row_data)参考 https://www.cnblogs.com/liulinghua90/p/9935642.html