日常办公实用技巧：利用Python 操作 Excel 数据封装函数！！！

科技 2024-10-16 08:30 湖北

来源：网络

对比其它编程语言，我们都知道Python最大的优势是代码简单，有丰富的第三方开源库供开发者使用。伴随着近几年数据分析的热度，Python也成为最受欢迎的编程语言之一。而对于数据的读取和存储，对于普通人来讲，除了数据库之外，最常见的就是微软的Excel。

1. 前期准备

1.1. 初识Excel

Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。

1.2. 格式区别

Excel中有xls和xlsx两种格式，它们之间的区别是：

文件格式不同。xls是一个特有的二进制格式，其核心结构是复合文档类型的结构，而xlsx的核心结构是XML类型的结构，采用的是基于 XML的压缩方式，使其占用的空间更小。xlsx 中最后一个 x 的意义就在于此。
版本不同。xls是Excel2003及以前版本生成的文件格式，而xlsx是Excel2007及以后版本生成的文件格式。
兼容性不同。xlsx格式是向下兼容的，可兼容xls格式。

1.3. 库的使用

Python自带的模块中有针对xls格式的xlrd和xlwt模块，但这两个库仅仅是针对xls的操作，当我们要操作xlsx格式文件时，则需要使用到openpyxl第三方库。

1.4. 整体思路

当使用以上几个模块的时候，从理论上我们就可以完全操作不同格式的Excel的读和写，很多人就疑惑，那这篇文章的作用是什么？我们直接学习对应的这三个模块不就好了吗？

答案就是：虽然这几个库已经把Excel的文件、表、行、列的概念完全转换为Python中的对象，但每次操作都需要遍历每一个单元格，甚至很多时候我们要花费大量的时间在思考循环单元格的边界上，这本身就是在重复造轮子，因此我花了半天时间整理了以下六个函数。

2. 代码展示

2.1. xlz格式

2.1.1. 读取xls格式文件

def read_xls_excel(url,index):
    '''
    读取xls格式文件
    参数：
        url:文件路径
        index：工作表序号（第几个工作表，传入参数从1开始数）
    返回：
        data:表格中的数据
    '''
    # 打开指定的工作簿
    workbook = xlrd.open_workbook(url)
    # 获取工作簿中的所有表格
    sheets = workbook.sheet_names()
    # 获取工作簿中所有表格中的的第 index 个表格
    worksheet = workbook.sheet_by_name(sheets[index-1])
    # 定义列表存储表格数据
    data = []
    # 遍历每一行数据
    for i in range(0, worksheet.nrows):
        # 定义表格存储每一行数据
        da = []
        # 遍历每一列数据
        for j in range(0, worksheet.ncols):
            # 将行数据存储到da列表
            da.append(worksheet.cell_value(i, j))
        # 存储每一行数据
        data.append(da)
    # 返回数据
    return data

2.1.2. 写入xls格式文件

def write_xls_excel(url,sheet_name,two_dimensional_data):
  '''
    写入xls格式文件
    参数：
        url:文件路径
        sheet_name:表名
        two_dimensional_data：将要写入表格的数据（二维列表）
    '''
    # 创建工作簿对象
    workbook = xlwt.Workbook()
    # 创建工作表对象
    sheet = workbook.add_sheet(sheet_name)
    # 遍历每一行数据
    for i in range(0,len(two_dimensional_data)):
        # 遍历每一列数据
        for j in range(0,len(two_dimensional_data[i])):
            # 写入数据
            sheet.write(i,j,two_dimensional_data[i][j])
    # 保存
    workbook.save(url)
    print("写入成功")

2.1.3. 追加写入xls格式文件

def write_xls_excel_add(url, two_dimensional_data, index):
    '''
    追加写入xls格式文件
    参数：
        url:文件路径
        two_dimensional_data：将要写入表格的数据（二维列表）
        index：指定要追加的表的序号（第几个工作表，传入参数从1开始数）
    '''
    # 打开指定的工作簿
    workbook = xlrd.open_workbook(url)
    # 获取工作簿中的所有表格
    sheets = workbook.sheet_names()
    # 获取指定的表
    worksheet = workbook.sheet_by_name(sheets[index-1])
    # 获取表格中已存在的数据的行数
    rows_old = worksheet.nrows
    # 将xlrd对象拷贝转化为xlwt对象
    new_workbook = copy(workbook)
    # 获取转化后工作簿中的第index个表格
    new_worksheet = new_workbook.get_sheet(index-1)
    # 遍历每一行数据
    for i in range(0, len(two_dimensional_data)):
        # 遍历每一列数据
        for j in range(0, len(two_dimensional_data[i])):
            # 追加写入数据，注意是从i+rows_old行开始写入
            new_worksheet.write(i+rows_old, j, two_dimensional_data[i][j])
    # 保存工作簿
    new_workbook.save(url)
    print("追加写入成功")

2.2. xlsx格式

2.2.1. 读取xlsx格式文件

def read_xlsx_excel(url, sheet_name):
    '''
    读取xlsx格式文件
    参数：
        url:文件路径
        sheet_name:表名
    返回：
        data:表格中的数据
    '''
    # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象
    workbook = openpyxl.load_workbook(url)
    # 根据指定表名获取表格并得到对应的sheet对象
    sheet = workbook[sheet_name]
    # 定义列表存储表格数据
    data = []
    # 遍历表格的每一行
    for row in sheet.rows:
        # 定义表格存储每一行数据
        da = []
        # 从每一行中遍历每一个单元格
        for cell in row:
            # 将行数据存储到da列表
            da.append(cell.value)
        # 存储每一行数据
        data.append(da)
    # 返回数据
    return data

2.2.2. 写入xlsx格式文件

def write_xlsx_excel(url, sheet_name, two_dimensional_data):
    '''
    写入xlsx格式文件
    参数：
        url:文件路径
        sheet_name:表名
        two_dimensional_data：将要写入表格的数据（二维列表）
    '''
    # 创建工作簿对象
    workbook = openpyxl.Workbook()
    # 创建工作表对象
    sheet = workbook.active
    # 设置该工作表的名字
    sheet.title = sheet_name
    # 遍历表格的每一行
    for i in range(0, len(two_dimensional_data)):
        # 遍历表格的每一列
        for j in range(0, len(two_dimensional_data[i])):
            # 写入数据（注意openpyxl的行和列是从1开始的，和我们平时的认知是一样的）
            sheet.cell(row=i + 1, column=j + 1, value=str(two_dimensional_data[i][j]))
    # 保存到指定位置
    workbook.save(url)
    print("写入成功")

2.2.3. 追加写入xlsx格式文件

def write_xlsx_excel_add(url, sheet_name, two_dimensional_data):
    '''
    追加写入xlsx格式文件
    参数：
        url:文件路径
        sheet_name:表名
        two_dimensional_data：将要写入表格的数据（二维列表）
    '''
    # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象
    workbook = openpyxl.load_workbook(url)
    # 根据指定表名获取表格并得到对应的sheet对象
    sheet = workbook[sheet_name]
    for tdd in two_dimensional_data:
        sheet.append(tdd)
    # 保存到指定位置
    workbook.save(url)
    print("追加写入成功")

3. 结果测试

3.1. 读取测试

先准备两个Excel文件，如图所示

其内容如下：

测试代码：

输出结果：

结论：表明读取并没有问题！！！接下来测试写入

3.2. 写入测试

测试代码：

结果输出：

看到数据被覆盖了！！！接下来在上面修改后的数据的基础上测试追加写入

3.3. 追加写入测试

测试代码：

结果输出：

追加也没有问题！！

4. 总结

我们一直认为数据分析就应该以数据为主，而不应该把大量的代码花费在设计Excel表格的样式上，这样多少就有点主客颠倒的意思了。总之，希望这篇文章对正在学习Python的你有一定的帮助，如果对你有帮助的话，不妨点个赞和收藏吧！如果有什么意见和建议也欢迎在评论区留言！

关注【测试开发技术】，添加"星标"，获取每天技术干货，共同成长！

最新文章

惊爆！72.1K star 一款开源、功能强大实时监控与可视化的超炫神器！

推荐一个Python可视化模块，简单又好用！

太强了！14.7K star！Windows系统居然还有开源替代版了？！

裁员了，很严重，大家做好准备吧！

每个测试开发都要学的【自动化部署】，Devops，CI/CD！

IT技术人员如何做一次高水平工作汇报？

测试人员如何进行竞品分析？

Python爬虫必备的8大技巧，收藏！

强！63.2K star！一款可完全替代Postman、Insomnia 的开源替代品！

用Python实现十大经典排序算法(附动图)

互联网大厂职级：P6/P7/P8技能、薪资和成长路线全攻略！

说透性能测试：每个测试人都能学好的性能测试！

测试策略是什么？在团队开发过程中如何落地？

面试官问你：为什么频繁连接MySQL数据库会消耗很多资源？

软件质量保障中，如何降低漏测？可以从哪些方面入手！

推荐渗透测试中新手必练的10个靶场！

取代传统测试，这才是测试人未来5年最好的就业方向！

Selenium自动化测试实现滑动滑块验证码自动识别！

推荐一款专为Nginx设计的图形化管理工具: Nginx UI！

爆了！又一款高性能、无侵入的 Java 性能监控神器！

日常办公实用技巧：利用Python 操作 Excel 数据封装函数！！！

自动化测试中使用Pytest Fixture？推荐10种常见用法！

2024年最值得去的公司（互联网行业TOP30企业排名一览）

推荐10 个令人惊叹的 Python 自动化脚本！

一键生成 Dockerfile，告别手写烦恼！

几个被淘汰的Python库，请不要再用！

6个常见故障及排查方法，是个测试就得会~

随时撸代码，推荐两款工具，可随时在手机上玩转 Python！

动图展示 10 大 Git 命令，让你轻松掌握Git

历经五轮面试终于拿到微信的offer，却只能无奈放弃！

推荐6个最好的 JavaScript 和 Node.js 自动化网络爬虫工具！

「最佳实践」一款非常强大的开源性能测试工具Sysbench：开发者必备技能！

推荐一款Windows自动化利器: pywinauto！

前端 Chrome 调试技巧最全汇总！值得学习！

揭秘最为知名的黑客工具之一：Netcat！适用于安全测试、渗透测试、黑客攻击！

取代测试岗，国内又一新兴岗位在崛起！这才是测试人未来5年最好的就业方向！

强！推荐一款Python开源自动化脚本工具：AutoKey！

如何使用Postman搞定带有token认证的接口实战！

面试官问你：CPU狂飙900%，该怎么处理？

推荐一款流量录制回放工具：JVM-sandbox-repeater！

年薪96w！真心建议大家冲一冲新兴领域，工资高前景好

Python懒人必备：推荐7个高效实用的装饰器！

《黑神话 . 悟空》员工工资收入曝光！

年薪68w！全体测试人的新方向，工资高前景好！

JAVA应用测试，线上故障排查分析全套路！

推荐60+VSCode插件，终有一款你喜欢的！

推荐一款开源、一站式SQL审核查询平台！功能强大、安全可靠！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉