现在开始我们的识别教程
在这里你会得到一段代码,如下图所示:
这里我们只需要修改3个参数:输入地址、输出地址、新增一列文件名。
参数1:
首先是找到参数1:即发票存放的文件输入地址,见下图红色框内
再是,找到需要识别的PDF发票文件目录地址,见下图红色框
最后把输入地址替换成需要识别的PDF发票文件目录地址,即可。
注意:
如果只识别一张发票,参数1是这样:文件夹地址+发票的名称
pdf_path=r’D:\Double羊\发票地址\发票1.pdf’
如果样识别一个文件夹里所有发票,参数1是这样:文件夹地址
pdf_path=r’D:\Double羊\发票地址’
切记红色字体不可删除,绿色字体替换成需要识别发票文件的地址。
参数2:
首先是找到参数2:即发票识别后发票存放的文件输出地址,见下图红色框内
再是,找到识别后PDF发票文件存放目录地址,见下图红色框
最后把输出地址替换成识别后PDF发票文件存放目录地址,即可。
Output_path = r’D:\Double羊\发票识别结果文件’
重要的事情说三遍:红色字体不可删除,绿色字体替换成需要识别发票文件的地址。
注意!注意!注意!输入和输出文件夹必须是相互独立的,不能是相互包含关系。
参数3:
为了方便对识别结果进行再核对,在Excel中增加了一列文件名,见下图红色框。
因此增加了第三个参数file_name =True,见图
如果不需要文件名这一列,则是file_name =False,见图
修改完,这三个参数后就可以运行代码。单击鼠标右键,点击run,见下图
如果本文章对您有帮助,欢迎大家点赞、转发+收藏。
最后需要本行代码朋友,可以扫描下方二维码,添加小编微信。