SpringBoot + ITextPdf：高效生成 PDF 预览文件

科技 2024-10-08 13:40 浙江

背景

之前有其他哥们写过类似功能，通过解析数据动态生成pdf文件。但他用的那个技术jasper有点老了，资料不太好找，问过神奇的chatgpt后，了解到iTextPdf这个库，应该是比较好的选择。

解决方案

我们先观察下真实的开票预览的模板。

发票信息由两部分组成：

固定信息，例如购买方信息、销售方信息。
商品信息，可能有多行，需动态填充

很明显的一个主子结构。

了解了一下iTextPdf的相关api。要实现这个功能，其实我们需要分别生成两部分的发票信息，也就是两个pdf，然后将两个pdf拼接成同一个。

对于第一部分的固定信息，我们可以用Acrobat之类的pdf设计工具设计出一个模板，然后在java程序中读取并填充对应的模板值。

对于第二部分的商品信息，就需要获取商品数据，动态生成表格，当然iTextPdf是支持这一功能的。

分别得到两部分的pdf之后，再将其合并为同一个pdf就可以了。

具体实现

1.引入iTextPdf库

在pom文件中添加iTextPdf的对应依赖。其中 itext-asian 这个也是需要的，不然生成的pdf中无法显示中文

<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itextpdf</artifactId>
    <version>5.5.13.2</version>
</dependency>

<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itext-asian</artifactId>
    <version>5.2.0</version>
</dependency>

2.编辑对应模板

下载Adobe Acrobat工具，这部分就不细说了点击文件-创建-表单。如果你有现成的pdf文件，也可以在这步选择单一文件开始，没有的话就从头新建

通过放置文字和文字域来设计好表单模板。

注意，文字域“属性”里的名称就是最后使用iTextPdf填充时需要填充的对应字段。

3.编写java PDF生成程序

使用框架还是老一套的SpringBoot，但为了方便测试，不展示最终的成品接口，而是写在一个可执行的主方法里main里。

3.1 读取PDF模板文件

iTextPdf负责读取文件的Class是PdfReader,支持多种解析方式

可以读取文件路径，也支持直接传入文件的字节流

线上环境使用了字节流的读取方式。演示的主方法中使用了直接读取本地文件路径的方式。

// 读取本地文件，当然线上环境肯定不这么写
PdfReader reader = new PdfReader("C:\\Users\\User\\Desktop\\开票预览模板.pdf");
// 线上环境使用了s3服务器，会提前得到字节流 byte[] bytes
PdfReader reader = new PdfReader(bytes);

3.2 填写模板文件并生成固定信息的PDF文件

iTextPdf负责填充表单字段的Class是PdfStamper

Stamper，译文压模；母盘；模子；印章

用来形容把动态数据填充进已有的表单里，还挺形象的

注意 form.setField("purName","购买方对应公司"); 这里设值的key就是我们在设计表单时，文字域的名称。

// 临时输出流-表单
ByteArrayOutputStream bos1 = new ByteArrayOutputStream();
PdfStamper stamper = new PdfStamper(reader, bos1);


// 获取表单
AcroFields form = stamper.getAcroFields();
form.setGenerateAppearances(true);

// 表单填充
form.setField("purName","购买方对应公司");
stamper.close();

在实际的实现中，这里使用了一个Map<String,String> map 遍历所有entrySet，将值通过setField(entrySet.key(),entrySet.value())方法填充至表单

3.3 动态创建表格并生成商品信息的PDF文件

搞定了第一部分的PDF文件，我们再来处理第二部分的PDF文件：生成商品列表。

这里我们需要新建一个Document，在这个Document中动态创建一个表格对象PdfPTable

最后将Document关闭。调用Document.close()时会触发输出流ByteArrayOutputStream的更新。

另外还有一个要点是，如果表格要显示中文，那么输出的内容格必须设置中文字体，否则无法显示。

我们来看一下填充一个最简单的Pdf表格是怎么做的

// 最简单的示例
import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.PdfPTable;
import com.itextpdf.text.pdf.PdfWriter;

import java.io.FileOutputStream;

public class AdjustTablePositionInPdf {
    public static void main(String[] args) {
        try {
            // 创建一个新的 PDF 文档
            Document document = new Document(PageSize.A4);
            PdfWriter.getInstance(document, new FileOutputStream("C:\\Users\\User\\Desktop\\adjusted_table_position.pdf"));
            document.open();

            // 添加文本内容
            document.add(new Paragraph("Test PDF with Table"));

            // 创建表格
            PdfPTable table = new PdfPTable(2);
            table.addCell("Name");
            table.addCell("Age");
            table.addCell("Alice");
            table.addCell("25");
            table.addCell("Bob");
            table.addCell("30");

            // 设置表格之前的间距
            table.setSpacingBefore(20f);

            // 设置表格之后的间距
            table.setSpacingAfter(20f);

            // 设置表格的总宽度
            table.setTotalWidth(300f);

            // 将表格添加到 PDF
            document.add(table);

            document.close();

            System.out.println("PDF 文件生成成功！");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

声明PdfPTable对象后（需指定列的数目），通过调用Table.addCell()方法添加行数据。

Table.addCell()会自动切换行的。假如表有两列，连续调用三个Table.addCell()方法，第三个方法就会自动切换到第二行。

知道了这一点后，我们分析一下：对于表格的某一列，我们至少需要以下两个参数：表头中文名称，列的数据映射key

/**
*  表头信息
**/

@Data
@AllArgsConstructor
public class HeadRowMetaInfo {
    // 列中文名
    private String colName;
    // 列key
    private String colKey;
    // 列宽度
    private float width;
}

/**
 * 自定义头部信息
 * @return
 */
public static List<HeadRowMetaInfo> headInfos(){
    List<HeadRowMetaInfo> infos = new ArrayList<>();
    infos.add(new HeadRowMetaInfo("货物或应税劳务、服务名称","commodityName",80));
    infos.add(new HeadRowMetaInfo("规格型号","model",80));
    infos.add(new HeadRowMetaInfo("单位","pushUnitName",80));
    infos.add(new HeadRowMetaInfo("数量","orderNum",80));
    infos.add(new HeadRowMetaInfo("单价","orderPriceNoTax",80));
    infos.add(new HeadRowMetaInfo("不含税金额","orderAmount",80));
    infos.add(new HeadRowMetaInfo("税额","taxAmt",80));
    infos.add(new HeadRowMetaInfo("含税金额","orderAmountTax",80));
    infos.add(new HeadRowMetaInfo("税率","taxRate",80));
    return infos;
}

好了，我们继续来看我们的主方法

// 临时文件流-商品
ByteArrayOutputStream bos2 = new ByteArrayOutputStream();

// 获取原页面的尺寸和样式
Document document = new Document(reader.getPageSize(1));
PdfWriter writer = PdfWriter.getInstance(document, bos2);

document.open();
//新创建一页来存放后面生成的表格
document.newPage();

// 获取商品导出数据
List<Map<String, Object>> mapData = otherService.getData();
// 全局统一字体，不设置无法显示中文
// 创建支持中文的字体
BaseFont bfChinese = BaseFont.createFont("STSongStd-Light", "UniGB-UCS2-H", false);
Font font = new Font(bfChinese, 12, Font.NORMAL, BaseColor.BLACK);

PdfPTable table = generatePdfPTable(720f,font,mapData,headInfos());

document.add(table);
// 文档流关闭
// 关闭后才会触发ByteArrayOutputStream的流更新
document.close();
writer.close();

主方法中声明的，生成PDF表格的子方法为：

public static PdfPTable generatePdfPTable(float totalWidth, Font font, List<Map<String, Object>> data, List<HeadRowMetaInfo> headRowMetaInfos) throws DocumentException {
    // 多少列
    PdfPTable table = new PdfPTable(headRowMetaInfos.size());
    // 表宽度
    table.setTotalWidth(totalWidth);

    // 设置每列的宽度
    List<Float> flist = headRowMetaInfos.stream().map(HeadRowMetaInfo::getWidth).collect(Collectors.toList());
    float[] farr = new float[flist.size()];
    for(int i = 0;i<flist.size();i++){
        farr[i] = flist.get(i);
    }
    table.setWidths(farr);

    Map<Integer,String> indexToKeyMap = new HashMap<>();
    // 根据表头信息插入表头
    for(int i = 0 ;i < headRowMetaInfos.size();i++){
        table.addCell(new Phrase(headRowMetaInfos.get(i).getColName(),font));
        indexToKeyMap.put(i,headRowMetaInfos.get(i).getColKey());
    }

    // 添加行数据
    for(Map<String,Object> dataItem:data){
        for(int i=0;i<headRowMetaInfos.size();i++){
            if(dataItem.get(indexToKeyMap.get(i)) != null){
                table.addCell(new Phrase(dataItem.get(indexToKeyMap.get(i)).toString(),font));
            }else{
                table.addCell("-");
            }
        }
    }

    // 计算表格在页面上的位置并添加到页面
    // 注意：这里的坐标可能需要根据实际情况调整
    table.setLockedWidth(true);
    return table;
}

3.4 拼接两个PDF文件

public static byte[] copy(List<byte[]> files) throws DocumentException, IOException {
    // 创建文档对象
    Document document = new Document();
    // 创建PdfCopy对象
    ByteArrayOutputStream bos = new ByteArrayOutputStream();
    PdfCopy copy = new PdfCopy(document, bos);
    // 设置只读
    copy.setEncryption(null, null, PdfWriter.ALLOW_PRINTING, PdfWriter.STANDARD_ENCRYPTION_128);


    // 打开文档
    document.open();
    PdfReader reader;
    int n;
    // 循环遍历所有PDF文件
    for (byte[] file : files) {
        reader = new PdfReader(file);
        // 获取每个PDF文件的页数
        n = reader.getNumberOfPages();
        for (int page = 0; page < n; ) {
            // 向PdfCopy添加每一页
            copy.addPage(copy.getImportedPage(reader, ++page));
        }
        // 关闭PdfReader
        reader.close();
    }

    // 关闭文档，否则输出流不会刷新
    document.close();

    byte[] bytes = bos.toByteArray();

    // 关闭流
    bos.close();
    return bytes;
}

3.5 输出

用于线上环境的接口，在此处得到了字节流之后就上传s3了在演示用的主函数里，将字节流保存为了本地文件

log.info(returnPath +" pdf模板填充成功，进行合并");
List<byte[]> files = new ArrayList<>();
files.add(bos1.toByteArray());
files.add(bos2.toByteArray());
// 合并两个pdf流
byte[] s3bytes = copy(files);

// 关闭流
bos1.close();
bos2.close();
reader.close();

// 有流之后 可以把流存储至本地文件，也可以上传s3了
String outputPath = "C:\\Users\\User\\Desktop\\test3.pdf";
FileOutputStream fileOutputStream = new FileOutputStream(outputPath);
fileOutputStream.write(s3bytes);
fileOutputStream.close();

总结

通过这次的需求学习到了JAVA里生成操作pdf文件的方法。先制作PDF表格模板，设置文字域，可以处理掉导出数据中的固定部分数据针对表格类的数据，长度不固定，需要通过生成PDF表格来进行处理。

最后说一句（别白嫖，求关注）

陈某每一篇文章都是精心输出，已经写了3个专栏，整理成PDF，获取方式如下：

《Spring Cloud 进阶》PDF：关注公众号：【码猿技术专栏】回复关键词 Spring Cloud 进阶获取！
《Spring Boot 进阶》PDF：关注公众号：【码猿技术专栏】回复关键词 Spring Boot进阶获取！
《Mybatis 进阶》PDF：关注公众号：【码猿技术专栏】回复关键词 Mybatis 进阶获取！

如果这篇文章对你有所帮助，或者有所启发的话，帮忙点赞、在看、转发、收藏，你的支持就是我坚持下去的最大动力！

http://mp.weixin.qq.com/s?__biz=MzU3MDAzNDg1MA==&mid=2247535015&idx=1&sn=9372e856df822b969752ce0d0536595e

码猿技术专栏

前蚂蚁P8，纯粹的技术人，以专栏的形式分享java全栈技术，求职面试、进阶网站：java-family.cn

面试官：post为什么会发送两次请求？

公司大佬对 Excel 导入、导出的封装，那叫一个妙啊！

学会这招，来给你的 SpringBoot 工程部署的 jar 包瘦瘦身吧！

SpringBoot+Flowable 太强了！

这款轻量级 Java 表达式引擎，真不错！

再见 EasyExcel ！

SpringBoot 实现图片阅后即焚功能！

SpringBoot + minio + kkfile 实现文件预览

别再使用 RestTemplate了，来了解一下官方推荐的 WebClient ！

这个Spring Boot脚手架太好用了！

强烈建议尽快搞个软考证！（重大利好）

B站疯传！一整套Java资料，白拿不谢！

Jedis那么低性能，还在用？赶紧换上 lettuce 吧！

国家整治程序员的高薪现象？看完悬着的心终于....

BigDecimal为什么可以不丢失精度？

替代ELK：ClickHouse+Kafka+FlieBeat

太顶了！SpringBoot + Java DL4J 实现交通标志识别

CK、ES、RediSearch 谁才是性能之王？

决定弃用 Nacos 了！

玩玩阿里神器 Seata，真不错！

玩玩大厂都在用的 JavaAgent

Seata+TCC 解决分布式事务，真香！

SpringBoot + ITextPdf：高效生成 PDF 预览文件

动态切换实现类框架，快看看 Spring-Smart-DI 是不是你的菜？

Spring Boot 接口数据加解密，太方便了！

SpringBoot 集成WebSocket 的 3 种集成方式

打算跳槽的兄弟要准备起来了。。。

Spring Cloud Gateway CORS 方案一次说清楚~

Spring Boot + 事务钩子函数，太强了！

消息队列轻松实现分布式 webSocket

Jenkins + Docker 一键自动化部署 Spring Boot 项目

SpringBoot异步接口实现：提高系统的吞吐量

阿里限流神器Sentinel 17 问？

9月，终于迈过了60k这道坎！

从实现原理来讲，Nacos 为什么这么强？

5 种 API 网关技术选型

一行代码，实现请假审批流程（Java版）

SpringBoot 接口防抖的一些实现方案

线程池中线程抛了异常，该如何处理？

10 种超赞的 MyBatis 写法！

千万级数据的全表update的正确姿势！

@Async注解有坑，小心！

Java8 中一个极其强悍的新接口，很多人没用过

解密阿里大神写的天书般的Tree工具类，轻松搞定树结构！

今年 Java 面试变了，打算跳槽的兄弟看一下！

规则引擎深度对比，LiteFlow vs Drools！

使用Hutool要注意了！升级到6.0后你调用的所有方法都将报错

if 判断泛滥？试一试规则执行器，太香了！

恭喜了！想涨工资的程序员，终于赶上好时候了！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉