python实现读取excel的简单介绍

本文目录一览：

1、如何用python读取excel文件?
2、python 操作excel 读写 xlsx
3、使用python读取excel中的数据，并重新写入到新的excel中
4、怎样用python，读取excel中的一列数据
5、Python的excel读取和写入
6、python对excel操作

如何用python读取excel文件?

1.首先说明我是使用的python3.5，我的office版本是2010，首先打开dos命令窗，安装必须的两个库，命令是：

pip3 install xlrd

Pip3 install xlwt

2.准备好excel，例如我的一个工作文件，我放在D盘/百度经验/11.xlsx，只有一个页签A，内容是一些销售数据

3.打开pycharm，新建一个excel.py的文件，首先导入支持库

import xlrdimport xlwt

4.针对刚入门的新手，先介绍三个知识，第一个:获取excel的sheet名称，第二：获取excel行数与列数，第三：获取第几行第几列的具体值，这是最常用的三个知识点

5.贴出代码，具体分析：

(1)要操作excel，首先得打开excel，使用open_workbook(‘路径’)

(2)要获取行与列，使用nrows(行)，ncols(列)

(3)获取具体的值，使用cell(row,col).value

workbook=xlrd.open_workbook(r'E:11.xlsx')print (workbook.sheet_names()) sheet2=workbook.sheet_by_name('A') nrows=sheet2.nrows ncols=sheet2.ncols print(nrows,ncols) cell_A=sheet2.cell(1,1).value print(cell_A)

6.要在excel里写入值，就要使用write属性,重点说明写入是用到xlwt这个支援库，思路是先新建excel，然后新建页签B，然后将一组数据写入到B，最后保存为excel.xls，这里建议保存为2003的格式，大部分电脑都能打开，特别注意保存的excel的路径是在python工作文件的目录下面，贴出代码：

stus = [['年', '月'], ['2018', '10'], ['2017', '9'], ['2016', '8']]Excel = xlwt.Workbook() # 新建excelsheet = Excel.add_sheet('B') #新建页签Brow = 0for stu in stus: col = 0 for s in stu: sheet.write(row, col, s) #开始写入 col = col + 1 row = row + 1Excel.save('Excel.xls') #保存

关于如何用python读取excel文件，环球青藤小编就和大家分享到这里了，学习是永无止境的，学习一项技能更是受益终身，所以，只要肯努力学，什么时候开始都不晚。如果您还想继续了解关于python编程的学习方法及素材等内容，可以点击本站其他文章学习。

python 操作excel 读写 xlsx

原文非常清晰，全程无bug，调试通过，留作记录以防丢失

一、xlrd和xlwt

使用之前需要先安装，windows上如果直接在cmd中运行python则需要先执行pip3 install xlrd和pip3 install xlwt，如果使用pycharm则需要在项目的解释器中安装这两个模块，File-Settings-Project:layout-Project Interpreter，点击右侧界面的＋号，然后搜索xlrd和xlwt，然后点击Install Package进行安装。

对于excel来说，整个excel文件称为工作簿，工作簿中的每个页称为工作表，工作表又由单元格组成。

对于xlrd和xlwt，行数和列数从0开始，单元格的行和列也从0开始，例如sheet.row_values(2)表示第三行的内容，sheet.cell(1,2).value表示第二行第三列单元格的内容。

1.xlrd模块读取excel文件

使用xlrd模块之前需要先导入import xlrd，xlrd模块既可读取xls文件也可读取xlsx文件。

获取工作簿对象：book = xlrd.open_workbook('excel文件名称')

获取所有工作表名称：names = book.sheet_names()，结果为列表

根据索引获取工作表对象：sheet = book.sheet_by_index(i)

根据名称获取工作表对象：sheet = book.sheet_by_name('工作表名称')

获取工作表行数：rows = sheet.nrows

获取工作表列数：cols = sheet.ncols

获取工作表某一行的内容：row = sheet.row_values(i) ，结果为列表【sheet.row(i)，列表】

获取工作表某一列的内容：col = sheet.col_values(i) 结果为列表【sheet.col(i)，列表】

获取工作表某一单元格的内容：cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value，sheet.col(n)[m].value，结果为字符串或数值【sheet.cell(0,0)，xlrd.sheet.Cell对象】

示例：假设在py执行文件同层目录下有一fruit.xls文件，有三个sheet页Sheet1、Sheet2、Sheet3，其中Sheet1内容如下：

import xlrd

book = xlrd.open_workbook('fruit.xls')print('sheet页名称:',book.sheet_names())

sheet = book.sheet_by_index(0)

rows = sheet.nrows

cols = sheet.ncolsprint('该工作表有%d行，%d列.'%(rows,cols))print('第三行内容为:',sheet.row_values(2))print('第二列内容为%s,数据类型为%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列内容为%s,数据类型为%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的单元格内容为:',sheet.cell_value(1,1))print('第三行第二列的单元格内容为:',sheet.cell(2,1).value)print('第五行第三列的单元格内容为:',sheet.row(4)[2].value)print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 执行结果# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 该工作表有5行，3列.# 第三行内容为: ['梨', 3.5, 130.0]# 第二列内容为['单价/元', 8.0, 3.5, 4.5, 3.8],数据类型为class 'list'.# 第二列内容为[text:'单价/元', number:8.0, number:3.5, number:4.5, number:3.8],数据类型为class 'list'.# 第二行第二列的单元格内容为: 8.0# 第三行第二列的单元格内容为: 3.5# 第五行第三列的单元格内容为: 300.0# 第五行第三列的单元格内容为300.0,数据类型为class 'float'# 第五行第三列的单元格内容为number:300.0,数据类型为class 'xlrd.sheet.Cell'

可以看出通过sheet.row(i)、sheet.col(i)也可获取行或列的内容，并且结果也是一个列表，但是列表中的每一项类似字典的键值对，形式为数据类型:值。

而sheet.cell(0,0)获取单元格内容，结果是一个键值对，并且是一个xlrd.sheet.Cell对象。

2.xlwt写入excel文件

使用xlwt模块之前需要先导入import xlwt，xlwt模块只能写xls文件，不能写xlsx文件(写xlsx程序不会报错，但最后文件无法直接打开，会报错)。

创建工作簿：book = xlwt.Workbook()，如果写入中文为乱码，可添加参数encoding = 'utf-8'

创建工作表：sheet = book.add_sheet('Sheet1')

向单元格写入内容：sheet.write(m,n,'内容1')、sheet.write(x,y,'内容2')

保存工作簿：book.save('excel文件名称')，默认保存在py文件相同路径下，如果该路径下有相同文件，会被新创建的文件覆盖，即xlwt不能修改文件。

import xlwt

book = xlwt.Workbook()

sheet = book.add_sheet('Sheet1')

sheet.write(0,0,'hello')

sheet.write(1,0,'你好')

book.save('hello.xls')

逐个单元格写入excel比较麻烦，可以按行或者列写入。

import xlwt

proj = ['名称','单价/元','库存/kg']

fruit = ['苹果','梨','香蕉','橘子']

price = [8,3.5,4.5,3.8]

storage = [150,130,100,300]

book = xlwt.Workbook()

sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):

sheet.write(0,i,proj[i]) #按行插入行标题foriin range(0,len(fruit)):

sheet.write(i+1,0,fruit[i])#插入第一列水果名称foriin range(0,len(price)):

sheet.write(i+1,1,price[i])#插入第二列单价foriin range(0,len(storage)):

sheet.write(i+1,2,storage[i])#插入第三列库存book.save('fruit2.xls')

二、openpyxl模块

openpyxl模块可实现对excel文件的读、写和修改，只能处理xlsx文件，不能处理xls文件，使用之前同样需要先安装该模块，再导入 import openpyxl。

对于openpyxl，行数和列数都从1开始，单元格的行和列也从1开始。例如sheet.cell(1,2).value表示第一行第二列单元格的内容

1.openpyxl读取excel文件

获取工作簿对象：book = openpyxl.load_workbook('excel文件名称')

获取所有工作表名称：names = book.sheetnames

获取工作表对象：sheet1 = book.worksheets[n]、sheet2 = book['工作表名称']、sheet3 = book[book.sheetnames[n]]

获取工作表名称：title = sheet1.title

获取工作表行数：rows = sheet1.max_row

获取工作表列数：cols = sheet1.max_column

获取某一单元格内容：cell = sheet.cell(1,2).value、sheet['单元格'].value例如sheet['B1'].value

假设有一fruit2.xlsx，除后缀名其他与上述fruit.xls完全一样

import openpyxl

book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet页名称：',book.sheetnames)

sheet = book.worksheets[0]

sheet2 = book['Sheet1']

sheet3 = book[book.sheetnames[0]]print('工作表名称：',sheet3.title)

rows = sheet.max_row

cols = sheet.max_columnprint('该工作表有%d行，%d列.'%(rows,cols))# 执行结果# 所有sheet页名称： ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名称： Sheet1# 该工作表有5行，3列.

2.行和列生成器

对于xlrd模块来说，可直接通过sheet.row[i]和sheet.col[i]获取行和列的内容，但是对于openpyxl模块来说，无法直接获取某一行或列的内容，openpyxl模块的sheet.rows和sheet.columns表示行和列的生成器，即generator object，需要通过循环或转换成列表、元组的形式得到行或列的值。

print(sheet.rows,sheet.columns)forcolin sheet.columns:

print(col)forrowin sheet.rows:

foriin row:

print(i.value,end='')

print()# 执行结果# generator object Worksheet._cells_by_row at 0x00000230E011A2A0 generator object Worksheet._cells_by_col at 0x00000230E102FC00# (Cell 'Sheet1'.A1, Cell 'Sheet1'.A2, Cell 'Sheet1'.A3, Cell 'Sheet1'.A4, Cell 'Sheet1'.A5)# (Cell 'Sheet1'.B1, Cell 'Sheet1'.B2, Cell 'Sheet1'.B3, Cell 'Sheet1'.B4, Cell 'Sheet1'.B5)# (Cell 'Sheet1'.C1, Cell 'Sheet1'.C2, Cell 'Sheet1'.C3, Cell 'Sheet1'.C4, Cell 'Sheet1'.C5)# 名称单价/元库存/kg# 苹果 8 150# 梨 3.5 130# 香蕉 4.5 100# 橘子 3.8 300

如果要获取某一行或者列的内容，可将行、列生成器对象转换成列表或者元组，再循环列表或者元组得到内容。

前面说过openpyxl模块的行和列都从1开始，但是由于将生成器转化成了列表list(sheet.rows)，而列表的索引从0开始，因此list(sheet.rows)[1]还是表示第二行的内容，不是第一行的内容。

foriinlist(sheet.rows)[1]:

print(i.value,end='')print()foriin list(sheet.columns)[0]:

print(i.value,end='')# 执行结果# 苹果 8 150# 名称苹果梨香蕉橘子

获取单元格的内容

print(sheet.cell(1,2).value)#第一行第二列单元格的内容print(sheet['a2'].value)#使用excel单元格的表示法，字母不区分大小写

3.openpyxl写excel文件

创建工作簿：book = openpyxl.Workbook()，如果写入中文为乱码，可添加参数encoding = 'utf-8'

创建工作表： sheet = book.create_sheet('工作表名称',0)，0表示创建的工作表在工作薄最前面

向单元格写入内容：sheet.cell(m,n,'内容1')、sheet.cell(x,y,'内容2')

保存工作簿：book.save('excel文件名称')，默认保存在py文件相同路径下，如果该路径下有相同文件，会被新创建的文件覆盖。

book = openpyxl.Workbook()

sheet = book.create_sheet('Sheet1',0)

proj = ['名称','单价/元','库存/kg']

fruit = ['苹果','香蕉','梨','橘子']

price = [8,3.5,4.5,3.8]

storage = [150,130,300,100]foriin range(len(proj)):

sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):

sheet.cell(i+2,1,fruit[i])foriin range(len(price)):

sheet.cell(i+2,2,price[i])foriin range(len(storage)):

sheet.cell(i+2,3,storage[i])

book.save('fruit2.xlsx')

4.openpyxl修改excel文件

sheet.insert_rows(m)和sheet.insert_cols(n)分别表示在第m行、第n列前面插入行、列

sheet.delete_rows(m)和sheet.delete_cols(n)分别表示删除第m行、第n列

rows = sheet.max_row

sheet.insert_rows(rows+2)

cherry = ['樱桃',17,80] forjin cherry:

sheet.cell(rows+1,cherry.index(j)+1,j)

book.save('fruit2.xlsx')

修改单元格内容：sheet.cell(m,n) = '内容1'或者sheet['B3'] = '内容2'

sheet.cell(3,2,4)

sheet['B3'] = 5book.save('fruit2.xlsx')

在最后追加行：sheet.append(可迭代对象)

straberry = ['草莓',20,50]

sheet.append(straberry)

book.save('fruit2.xlsx')

三、xlsxwriter 模块

只能操作xlsx，只能写。在excel中插入图片

import matplotlib.pyplot as plt

2 import pandas as pd

3 import random

4 import xlsxwriter

6 ts = pd.Series(random.randrange(10))

7 fig = plt.figure()

8 ax = fig.add_subplot(1,1,1)

9 ts.plot(ax=ax)

10 fig.savefig('foo.png')

12 workbook = xlsxwriter.Workbook('pngxls.xlsx') # 创建excel文件

13 worksheet1 = workbook.add_worksheet('png') # 括号内为工作表表名

14 # 第一个参数是插入的起始单元格，第二个参数是图片你文件的绝对路径

15 worksheet1.write('A1','hello')

16 worksheet1.insert_image('B2','foo.png')

18 workbook.close()

xlrd、xlwt和openpyxl处理excel文件，在写入文件的时候不如pandas简单，pandas处理excel文件见另外一篇博客

使用python读取excel中的数据，并重新写入到新的excel中

使用Python3运行

起初是读取excel中的数据，进行相关的计算将结果追加在后面，没有找到合适的办法，就只能采用这种读取数据，进行相关操作，重新写入的方法

(1)使用xlrd打开xls文件，读取数据

(2)将需要的数据放进list中，进行相应的计算得出结果

(3)使用xlutils的copy将xlrd对象转化为xlwt对象

(4)使用转化的xlwt对象的write方法，将结果写入

(5)使用xlwt的save进行保存

主要用它读取Excel数据

主要用它来将数据写入到excel中

主要用xlutils的copy方法将xlrd对象转化为xlwt对象，好来进行写入

删除了一些东西大致如下

怎样用python，读取excel中的一列数据

用python读取excel中的一列数据步骤如下：

1、首先打开dos命令窗，安装必须的两个库，命令是：pip3 install xlrd；Pip3 install xlwt。

2、准备好excel。

3、打开pycharm，新建一个excel.py的文件，首先导入支持库import xlrdimport xlwt。

4、要操作excel，首先得打开excel，使用open_workbook(‘路径’)，要获取行与列，使用nrows(行)，ncols(列)，获取具体的值，使用cell（row,col）.value。

5、要在excel里写入值，就要使用write属性,重点说明写入是用到xlwt这个支援库，思路是先新建excel，然后新建页签B，然后将一组数据写入到B，最后保存为excel.xls。

Python的excel读取和写入

现在常用的处理excel的方法大多是numpy，但是之前已经习惯了用xlrd的工具，所以也记录一下祖传的excel读取/创建/写入：

1.读取excel：

2.创建一个excel：

3.写入excel：

python对excel操作

Python对于Excel的操作是多种多样的，掌握了相关用法就可以随心所欲的操作数据了！

操作xls文件

xlrd（读操作）：

import xlrd

1、引入xlrd模块

workbook=xlrd.open_workbook("36.xls")

2、打开[36.xls]文件，获取excel文件的workbook（工作簿）对象

names=workbook.sheet_names()

3、获取所有sheet的名字

worksheet=workbook.sheet_by_index(0)

4、通过sheet索引获得sheet对象

worksheet为excel表第一个sheet表的实例化对象

worksheet=workbook.sheet_by_name("各省市")

5、通过sheet名获得sheet对象

worksheet为excel表sheet名为【各省市】的实例化对象

nrows=worksheet.nrows

6、获取该表的总行数

ncols=worksheet.ncols

7、获取该表的总列数

row_data=worksheet.row_values(n)

8、获取该表第n行的内容

col_data=worksheet.col_values(n)

9、获取该表第n列的内容

cell_value=worksheet.cell_value(i,j)

10、获取该表第i行第j列的单元格内容

xlwt（写操作）：

import xlwt

1、引入xlwt模块

book=xlwt.Workbook(encoding="utf-8")

2、创建一个Workbook对象，相当于创建了一个Excel文件

sheet = book.add_sheet('test')

3、创建一个sheet对象，一个sheet对象对应Excel文件中的一张表格。

sheet.write(i, j, '各省市')

4、向sheet表的第i行第j列，写入'各省市'

book.save('Data\36.xls')

5、保存为Data目录下【36.xls】文件

操作xlsx文件

openpyxl（读操作）：

import openpyxl

1、引入openpyxl模块

workbook=openpyxl.load_workbook("36.xlsx")

2、打开[36.xlsx]文件，获取excel文件的workbook（工作簿）对象

names=workbook.sheetnames

worksheet=workbook.worksheets[0]

worksheet=workbook["各省市"]

ws = workbook.active

6、获取当前活跃的worksheet,默认就是第一个worksheet

nrows=worksheet.max_row

7、获取该表的总行数

ncols=worksheet.max_column

8、获取该表的总列数

content_A1= worksheet['A1'].value

9、获取该表A1单元格的内容

content_A1=worksheet.cell(row=1,column=1).value

10、获取该表第1列第1列的内容

openpyxl（写操作）：

workbook=openpyxl.Workbook()worksheet = workbook.active

3、获取当前活跃的worksheet,默认就是第一个worksheet

worksheet.title="test"

4、worksheet的名称设置为"test"

worksheet = workbook.create_sheet()

5、创建一个新的sheet表，默认插在工作簿末尾

worksheet.cell(i,j,'空')

6、第i行第j列的值改成'空'

worksheet["B2"]="空"

7、将B2的值改成'空'

worksheet.insert_cols(1)

8、在第一列之前插入一列

worksheet.append(["新增","台湾省"])

9、添加行

workbook.save("Data\36.xlsx")

10、保存为Data目录下【36.xlsx】文件

pandas处理excel文件

pandas操作：

import pandas as pd

1、引入pandas模块

data = pd.read_excel('36.xls')

2、读取[36.xls]或者[36.xlsx]文件

data = pd.read_csv('36.csv')

3、读取[36.csv]文件

data=data.dropna(subset=['店铺'])

4、过滤掉data店铺列有缺失的数据

data.sort_values("客户网名", inplace=True)

5、将data数据按照客户网名列进行从小到大排序

data = pd.read_csv(36.csv, skiprows = [0,1,2],sep = None, skipfooter = 4)

6、读取[36.csv]文件，前三行和后四行的数据略过

data = data.fillna('空')

7、将data中的空白处填充成'空'

data.drop_duplicates('订单','first',inplace=True)

8、data中的数据，按照【订单】列做去重处理，保留第一条数据

data=pd.DataFrame(data,columns=['订单','仓库'])

9、只保留data中【订单】【仓库】列的数据

data = data[(data[u'展现量'] 0)]

10、只保留【展现量】列中大于0的数据

data= data[data["订单"].str.contains('000')]

11、只保留【订单】列中包含'000'的数据

data= data[data["仓库"]=='正品仓']

12、只保留【仓库】列是'正品仓'的数据

xs= data[data["店铺"]=='南极人']['销售额']

13、获取店铺是南极人的销售额数据

data['订单'] = data['订单'].str[3:7]

14、【订单】列的值只保留4-8个字节的值

data["邮资"] = np.where((data['店铺'].str.contains('T|t')) -(data['仓库'] == '代发仓'), 8, data['邮资'])

15、满足店铺列包含 T 或 t 并且仓库不等于'代发仓'的话，将邮资的值改成8，否则值不变

data = np.array(data).tolist()

16、将data从DataFrame转换成列表

data=pd.DataFrame(data)

17、将列表转换成DataFrame格式

zhan = data[u'展现'].sum().round(2)

18、将data中所有展现列数据求和，并取两位小数

sum=data.groupby(['店铺'])['刷单'].sum()

19、将data中按照店铺对刷单进行求和

counts=data['店铺'].value_counts()

20、将data按照店铺进行计算

avg=data.groupby(['店铺'])['刷单'].mean()

21、将data按照店铺对刷单进行求平均数

count = pd.concat([counts,sum], axis=1, ignore_index=True, sort=True)

22、将counts和sum两个DataFrame进行了组合

count=count.rename(index=str, columns={0: "订单", 1: "成本"})

23、将新生成的DataFrame列名进行修改

data = pd.merge(sum, counts, how='left', left_on='店铺', right_on='店铺')

24、将列表转换成DataFrame格式

from openpyxl import Workbook

wb=Workbook()

ws1=wb.active

data.to_excel('36.xlsx')

wb.close()

25、data完整的写入到关闭过程，执行此操作的时候【36.xlsx】不能是打开状态

excel格式操作

样式处理：

1、打开【36.xlsx】

sheet=workbook.worksheets[0]

2、将第一个sheet对象赋值给sheet

sheet.column_dimensions['A'].width = 20.0

3、将A列的宽度设置为20

sheet.row_dismensions[1].height = 20.0

4、将第一行的行高设置为20

sheet.merge_cells('A1:A2')

5、将sheet表A1和A2单元格合并

sheet.unmerge_cells('A1:A2')

6、将sheet表A1和A2单元格取消合并

sheet.insert_rows(2,2)

7、将sheet表从第2行插入2行

sheet.insert_cols(3,2)

8、将sheet表从第3列插入2列

sheet.delete_rows(2)

9、删除第2行

sheet.delete_cols(3, 2)

10、将sheet表从第3列开始删除2列

from openpyxl.styles import Font, Border, PatternFill, colors, Alignment

11、分别引入字体、边框、图案填充、颜色、对齐方式

sheet.cell(i,j).font = Font(name='Times New Roman', size=14, bold=True, color=colors.WHITE)

12、设置sheet表第 i 行第 j 列的字体

sheet.cell(i,j).alignment = Alignment(horizontal='center', vertical='center')

13、设置sheet表第 i 行第 j 列的字体对齐方式

left, right, top, bottom = [Side(style='thin', color='000000')] * 4sheet.cell(i,j).border = Border(left=left, right=right, top=top, bottom=bottom)

14、引入边框样式并调用

fill = PatternFill("solid", fgColor="1874CD")sheet.cell(1,j).fill = fill

15、引入填充样式，并调用

import xlrd

from openpyxl import Workbook

from openpyxl import load_workbook

workbook=load_workbook(filename='C:/Users/EDZ/Desktop/工作/2021.08.03/大兄弟.xlsx')

sheet=workbook.active

sheet.insert_cols(idx=1)

sheet.merge_cells(A1:A3)

sheet['A1']=['上海','山东','浙江']

python实现读取excel的简单介绍

本文目录一览：

如何用python读取excel文件?

python 操作excel 读 写 xlsx

使用python读取excel中的数据，并重新写入到新的excel中

怎样用python，读取excel中的一列数据

Python的excel读取和写入

python对excel操作

python 操作excel 读写 xlsx