SpringBoot + ITextPdf：高效生成 PDF 预览文件

科技 2024-10-01 14:41 安徽

来源：juejin.cn/post/7354656192351797298

👉 欢迎加入小哈的星球，你将获得: 专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论
新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍；
《从零手撸：前后端分离博客项目（全栈开发）》 2期已完结,演示链接：http://116.62.199.48/;
截止目前，累计输出 58w+ 字，讲解图 2330+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，Spring Cloud Alibaba 等等，戳我加入学习，解锁全部项目，已有2100+小伙伴加入

背景

其实公司之前的项目里是用到了帆软报表的，然而最近接了一个新项目，这个项目独立部署在甲方的独立环境中，组长的意思是不用再单独部署一套帆软报表，成本太大，用其他方式实现一下。虽然我不太理解成本大在哪儿，不过身为助理工程师，别管那么多，照着干就完事了。

之前有其他哥们写过类似功能，通过解析数据动态生成pdf文件。但他用的那个技术jasper有点老了，资料不太好找，问过神奇的chatgpt后，了解到iTextPdf这个库，应该是比较好的选择。

解决方案

我们先观察下真实的开票预览的模板。

发票信息由两部分组成：

固定信息，例如购买方信息、销售方信息。
商品信息，可能有多行，需动态填充

很明显的一个主子结构。

了解了一下iTextPdf的相关api。要实现这个功能，其实我们需要分别生成两部分的发票信息，也就是两个pdf，然后将两个pdf拼接成同一个。

对于第一部分的固定信息，我们可以用Acrobat之类的pdf设计工具设计出一个模板，然后在java程序中读取并填充对应的模板值。

对于第二部分的商品信息，就需要获取商品数据，动态生成表格，当然iTextPdf是支持这一功能的。

分别得到两部分的pdf之后，再将其合并为同一个pdf就可以了。

具体实现

1.引入iTextPdf库

在pom文件中添加iTextPdf的对应依赖。其中 itext-asian 这个也是需要的，不然生成的pdf中无法显示中文

<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itextpdf</artifactId>
    <version>5.5.13.2</version>
</dependency>

<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itext-asian</artifactId>
    <version>5.2.0</version>
</dependency>

2.编辑对应模板

下载Adobe Acrobat工具，这部分就不细说了点击文件-创建-表单。如果你有现成的pdf文件，也可以在这步选择单一文件开始，没有的话就从头新建

通过放置文字和文字域来设计好表单模板。

注意，文字域“属性”里的名称就是最后使用iTextPdf填充时需要填充的对应字段。

3.编写java PDF生成程序

使用框架还是老一套的SpringBoot，但为了方便测试，不展示最终的成品接口，而是写在一个可执行的主方法里main里。

3.1 读取PDF模板文件

iTextPdf负责读取文件的Class是PdfReader,支持多种解析方式

可以读取文件路径，也支持直接传入文件的字节流

线上环境使用了字节流的读取方式。演示的主方法中使用了直接读取本地文件路径的方式。

// 读取本地文件，当然线上环境肯定不这么写
PdfReader reader = new PdfReader("C:\\Users\\User\\Desktop\\开票预览模板.pdf");
// 线上环境使用了s3服务器，会提前得到字节流 byte[] bytes
PdfReader reader = new PdfReader(bytes);

3.2 填写模板文件并生成固定信息的PDF文件

iTextPdf负责填充表单字段的Class是PdfStamper

Stamper，译文压模；母盘；模子；印章

用来形容把动态数据填充进已有的表单里，还挺形象的

注意 form.setField("purName","购买方对应公司"); 这里设值的key就是我们在设计表单时，文字域的名称。

// 临时输出流-表单
ByteArrayOutputStream bos1 = new ByteArrayOutputStream();
PdfStamper stamper = new PdfStamper(reader, bos1);


// 获取表单
AcroFields form = stamper.getAcroFields();
form.setGenerateAppearances(true);

// 表单填充
form.setField("purName","购买方对应公司");
stamper.close();

在实际的实现中，这里使用了一个Map<String,String> map 遍历所有entrySet，将值通过setField(entrySet.key(),entrySet.value())方法填充至表单

3.3 动态创建表格并生成商品信息的PDF文件

搞定了第一部分的PDF文件，我们再来处理第二部分的PDF文件：生成商品列表。

这里我们需要新建一个Document，在这个Document中动态创建一个表格对象PdfPTable

最后将Document关闭。调用Document.close()时会触发输出流ByteArrayOutputStream的更新。

另外还有一个要点是，如果表格要显示中文，那么输出的内容格必须设置中文字体，否则无法显示。

我们来看一下填充一个最简单的Pdf表格是怎么做的

// 最简单的示例
import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.PdfPTable;
import com.itextpdf.text.pdf.PdfWriter;

import java.io.FileOutputStream;

public class AdjustTablePositionInPdf {
    public static void main(String[] args) {
        try {
            // 创建一个新的 PDF 文档
            Document document = new Document(PageSize.A4);
            PdfWriter.getInstance(document, new FileOutputStream("C:\\Users\\User\\Desktop\\adjusted_table_position.pdf"));
            document.open();

            // 添加文本内容
            document.add(new Paragraph("Test PDF with Table"));

            // 创建表格
            PdfPTable table = new PdfPTable(2);
            table.addCell("Name");
            table.addCell("Age");
            table.addCell("Alice");
            table.addCell("25");
            table.addCell("Bob");
            table.addCell("30");

            // 设置表格之前的间距
            table.setSpacingBefore(20f);

            // 设置表格之后的间距
            table.setSpacingAfter(20f);

            // 设置表格的总宽度
            table.setTotalWidth(300f);

            // 将表格添加到 PDF
            document.add(table);

            document.close();

            System.out.println("PDF 文件生成成功！");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

声明PdfPTable对象后（需指定列的数目），通过调用Table.addCell()方法添加行数据。

Table.addCell()会自动切换行的。假如表有两列，连续调用三个Table.addCell()方法，第三个方法就会自动切换到第二行。

知道了这一点后，我们分析一下：对于表格的某一列，我们至少需要以下两个参数：表头中文名称，列的数据映射key

/**
*  表头信息
**/

@Data
@AllArgsConstructor
public class HeadRowMetaInfo {
    // 列中文名
    private String colName;
    // 列key
    private String colKey;
    // 列宽度
    private float width;
}
/**
 * 自定义头部信息
 * @return
 */
public static List<HeadRowMetaInfo> headInfos(){
    List<HeadRowMetaInfo> infos = new ArrayList<>();
    infos.add(new HeadRowMetaInfo("货物或应税劳务、服务名称","commodityName",80));
    infos.add(new HeadRowMetaInfo("规格型号","model",80));
    infos.add(new HeadRowMetaInfo("单位","pushUnitName",80));
    infos.add(new HeadRowMetaInfo("数量","orderNum",80));
    infos.add(new HeadRowMetaInfo("单价","orderPriceNoTax",80));
    infos.add(new HeadRowMetaInfo("不含税金额","orderAmount",80));
    infos.add(new HeadRowMetaInfo("税额","taxAmt",80));
    infos.add(new HeadRowMetaInfo("含税金额","orderAmountTax",80));
    infos.add(new HeadRowMetaInfo("税率","taxRate",80));
    return infos;
}

好了，我们继续来看我们的主方法

// 临时文件流-商品
ByteArrayOutputStream bos2 = new ByteArrayOutputStream();

// 获取原页面的尺寸和样式
Document document = new Document(reader.getPageSize(1));
PdfWriter writer = PdfWriter.getInstance(document, bos2);

document.open();
//新创建一页来存放后面生成的表格
document.newPage();

// 获取商品导出数据
List<Map<String, Object>> mapData = otherService.getData();
// 全局统一字体，不设置无法显示中文
// 创建支持中文的字体
BaseFont bfChinese = BaseFont.createFont("STSongStd-Light", "UniGB-UCS2-H", false);
Font font = new Font(bfChinese, 12, Font.NORMAL, BaseColor.BLACK);

PdfPTable table = generatePdfPTable(720f,font,mapData,headInfos());

document.add(table);
// 文档流关闭
// 关闭后才会触发ByteArrayOutputStream的流更新
document.close();
writer.close();

主方法中声明的，生成PDF表格的子方法为：

public static PdfPTable generatePdfPTable(float totalWidth, Font font, List<Map<String, Object>> data, List<HeadRowMetaInfo> headRowMetaInfos) throws DocumentException {
    // 多少列
    PdfPTable table = new PdfPTable(headRowMetaInfos.size());
    // 表宽度
    table.setTotalWidth(totalWidth);

    // 设置每列的宽度
    List<Float> flist = headRowMetaInfos.stream().map(HeadRowMetaInfo::getWidth).collect(Collectors.toList());
    float[] farr = new float[flist.size()];
    for(int i = 0;i<flist.size();i++){
        farr[i] = flist.get(i);
    }
    table.setWidths(farr);

    Map<Integer,String> indexToKeyMap = new HashMap<>();
    // 根据表头信息插入表头
    for(int i = 0 ;i < headRowMetaInfos.size();i++){
        table.addCell(new Phrase(headRowMetaInfos.get(i).getColName(),font));
        indexToKeyMap.put(i,headRowMetaInfos.get(i).getColKey());
    }

    // 添加行数据
    for(Map<String,Object> dataItem:data){
        for(int i=0;i<headRowMetaInfos.size();i++){
            if(dataItem.get(indexToKeyMap.get(i)) != null){
                table.addCell(new Phrase(dataItem.get(indexToKeyMap.get(i)).toString(),font));
            }else{
                table.addCell("-");
            }
        }
    }

    // 计算表格在页面上的位置并添加到页面
    // 注意：这里的坐标可能需要根据实际情况调整
    table.setLockedWidth(true);
    return table;
}

3.4 拼接两个PDF文件

public static byte[] copy(List<byte[]> files) throws DocumentException, IOException {
    // 创建文档对象
    Document document = new Document();
    // 创建PdfCopy对象
    ByteArrayOutputStream bos = new ByteArrayOutputStream();
    PdfCopy copy = new PdfCopy(document, bos);
    // 设置只读
    copy.setEncryption(null, null, PdfWriter.ALLOW_PRINTING, PdfWriter.STANDARD_ENCRYPTION_128);


    // 打开文档
    document.open();
    PdfReader reader;
    int n;
    // 循环遍历所有PDF文件
    for (byte[] file : files) {
        reader = new PdfReader(file);
        // 获取每个PDF文件的页数
        n = reader.getNumberOfPages();
        for (int page = 0; page < n; ) {
            // 向PdfCopy添加每一页
            copy.addPage(copy.getImportedPage(reader, ++page));
        }
        // 关闭PdfReader
        reader.close();
    }

    // 关闭文档，否则输出流不会刷新
    document.close();

    byte[] bytes = bos.toByteArray();

    // 关闭流
    bos.close();
    return bytes;
}

3.5 输出

用于线上环境的接口，在此处得到了字节流之后就上传s3了在演示用的主函数里，将字节流保存为了本地文件

log.info(returnPath +" pdf模板填充成功，进行合并");
List<byte[]> files = new ArrayList<>();
files.add(bos1.toByteArray());
files.add(bos2.toByteArray());
// 合并两个pdf流
byte[] s3bytes = copy(files);

// 关闭流
bos1.close();
bos2.close();
reader.close();

// 有流之后 可以把流存储至本地文件，也可以上传s3了
String outputPath = "C:\\Users\\User\\Desktop\\test3.pdf";
FileOutputStream fileOutputStream = new FileOutputStream(outputPath);
fileOutputStream.write(s3bytes);
fileOutputStream.close();

总结

通过这次的需求学习到了JAVA里生成操作pdf文件的方法。先制作PDF表格模板，设置文字域，可以处理掉导出数据中的固定部分数据针对表格类的数据，长度不固定，需要通过生成PDF表格来进行处理。

👉 欢迎加入小哈的星球，你将获得: 专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论
新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍；
《从零手撸：前后端分离博客项目（全栈开发）》 2期已完结,演示链接：http://116.62.199.48/;
截止目前，累计输出 58w+ 字，讲解图 2330+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，Spring Cloud Alibaba 等等，戳我加入学习，解锁全部项目，已有2100+小伙伴加入


1. 我的私密学习小圈子~
2. logback VS log4j2：一倍左右的性能差异，是时候注意了！
3. Open-Feign 你真的会用了吗？
4. JD-hotkey：京东开源的利器，强得离谱！

最近面试BAT，整理一份面试资料《Java面试BATJ通关手册》，覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式：点“在看”，关注公众号并回复 Java 领取，更多内容陆续奉上。
PS：因公众号平台更改了推送规则，如果不想错过内容，记得读完点一下“在看”，加个“星标”，这样每次新文章推送才会第一时间出现在你的订阅列表里。
点“在看”支持小哈呀，谢谢啦

http://mp.weixin.qq.com/s?__biz=MzU2NDEyMzIzOA==&mid=2247504527&idx=1&sn=1653b087fba3462dfcb66d60c1e1bba2

Java学习者社区

专注于Java领域干货分享，不限于BAT面试,算法，数据库，SpringBoot,微服务,高并发,JVM,Docker容器，ELK相关知识，期待与您一同进步。

最新文章

提高系统吞吐量的一把利器：DeferredResult 到底有多强？

SpringBoot 不单独部署注册中心，如何实现注册中心功能？

让数据传输更优雅：SpringBoot 前后端加密技巧全攻略

面试官：Redis 大 key 多 key，你要怎么拆分？

一个注解，优雅的实现接口幂等性

公司大佬对 Excel 导入、导出的封装，那叫一个妙啊！

用了 6 年的Spring Boot 项目部署方案！打包 + Shell 脚本部署详解，稳的一批!

这款轻量级 Java 表达式引擎，真不错！

SpringBoot 官方强烈推荐，连接池，太快了！

应届生炒到73.5w年薪，真心建议冲冲这个新兴领域！

SpringBoot接口设计防篡改和防重放攻击

推荐一款完全开源的多端仓库管理系统

再见 EasyExcel ！

高手必会的 IDEA Debug 使用技巧，你都用过吗？

面试官：业务开发时，接口不能对外暴露怎么办？

SpringBoot + minio + kkfile 实现文件预览

这个技术太卷了，就是要革了小程序命

MySQL线上执行语句，监控与日志不可少

详解Java操作PDF：一键生成文件，插入文字、选项、签名及公章

裁员了，很严重，年底千万别离职

弃用 RestTemplate，来了解一下官方推荐的 WebClient ！

魔改 Arthas，又一款开源的线上问题定位神器

自建图床？Minio 太香辣！

高德开源API花式玩法：租房辅助工具

后端开挂：3行代码写出8个接口！

支持国家整治程序员的高薪现象？看完悬着的心终于....

left join 后用 on 还是 where？

工作炒股两不误，这款IDEA插件，各位股神值得拥有！

面试官：SpringBoot 如何实现多租户架构？

Nginx 实现动态封禁IP，详细教程来了

2人自建平台盗链影视作品狂赚3.92亿，结果3年起刑

一行代码，实现请假审批流程（Java版）

面试官：MySQL一次到底插入多少条数据合适啊？

快速搭建页面：一款开源可视化拖拽工具

做了个Java打包工具，可以双击启动了！

极简版 Java 敏感词检测工具

Java Http 接口对接太繁琐？试试 UniHttp 框架吧

聊聊大厂都怎么防止重复下单？

美团二面：为什么不推荐使用 MyBatis 二级缓存？大部分人都答不上来！

面试官：如果要存ip地址，用什么数据类型比较好

国产 Git 客户端全新选择！

你了解 SpringBoot 在一次 http 请求中耗费了多少内存吗？

75k，确实可以封神了

还在用 if (obj != null) 吗？这几招轻松解决空指针！

不想被恶意访问？SpringBoot 的 IP 白名单限制了解一下！

SpringBoot实现电子文件签字+合同系统！

比 MyBatis 快了 100 倍的 ORM 框架

为什么魂斗罗只有128KB却可以实现那么长的剧情？

每天骑的共享单车是什么通信原理，有人了解过吗？

SpringBoot + ITextPdf：高效生成 PDF 预览文件

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉