系列课程简介
“码动办公”系列课程旨在通过简单的编程提升日常办公效率,每期课程我们都将带你深入不同的办公场景,通过视频讲解和文字指导,帮助你10分钟进阶办公技能!
码动办公【1】
由pdf到excel·表格的轻松转换
目标
通过python编程,实现pdf表格数据到excel数据的转换。
内容
python 3.13版本的安装与环境配置;pandas和pdfplumber库的安装与使用;pdf2excel.py脚本的编写与运行。
作用
自动将pdf中的表格数据转化为excel格式;高效处理大量pdf文件,节省手动操作时间;适用于财务报告、数据分析等多种办公场景。
下载及环境配置
下载
首先在浏览器地址栏输入:Python.org进入Python官网,点击Download 显示截面如下,点击Python3.13.0进行下载。
安装
下载之后找到下载的Python文件,进入安装Python界面,选择Customize installation自定义安装,Advanced Options界面配置如下:
选择好安装路径之后点击install进行安装。
验证
安装之后,按住Win+R输入cmd打开命令行窗口,输入python -V,如果显示Python版本,说明Python安装成功。
安装库
在命令行界面,输入 pip install pandas等待pandas库安装完成。同理,再次输入pip install pdfplumber等待pdfplumber库安装完成。
使用介绍
如何使用
1.以记事本方式打开pdf2excel.py文件。
2.修改文件路径:在记事本中,找到需要修改的文件路径部分,并将此路径替换为你要转换的pdf文件的实际路径和文件名,确保路径无误后保存。
3.进入命令行工具:定位到pdf2excel.py所在的文件夹,再在地址栏中输入cmd并回车,这将在当前路径下打开命令行工具。
4.执行脚本:在命令行中输入以下命令:python pdf2excel.py
5.结果:脚本执行完毕后,检查pdf2excel.py文件所在的目录,会看到新生成的excel文件。该文件包含从pdf中提取的数据。
获取代码方式
点击下文“查看原文”获取代码,提取码:6666。
反馈群
END
图文来源/ 计算机学院
排版/ 容广聪
责任编辑/ 杨慕云 杨皓予
终审/ 魏佳艺 杨禹 李卓伦
投稿邮箱/ jsj_xuanchuan@zjut.edu.cn