性能爆表：SpringBoot利用ThreadPoolTaskExecutor批量插入百万级数据实测！

科技 2024-11-14 07:40 山西

关注我们,设为星标,每天7:40不见不散,架构路上与您共享

回复架构师获取资源

大家好，我是你们的朋友架构君，一个会写代码吟诗的架构师。

前言

开发目的：

提高百万级数据插入效率。

采取方案：

利用ThreadPoolTaskExecutor多线程批量插入。

采用技术：

springboot2.1.1
mybatisPlus3.0.6
swagger2.5.0
Lombok1.18.4
postgresql
ThreadPoolTaskExecutor

具体实现细节

application-dev.properties添加线程池配置信息

# 异步线程配置
# 配置核心线程数
async.executor.thread.core_pool_size = 30
# 配置最大线程数
async.executor.thread.max_pool_size = 30
# 配置队列大小
async.executor.thread.queue_capacity = 99988
# 配置线程池中的线程的名称前缀
async.executor.thread.name.prefix = async-importDB-

spring容器注入线程池bean对象

@Configuration
@EnableAsync
@Slf4j
public class ExecutorConfig {
    @Value("${async.executor.thread.core_pool_size}")
    private int corePoolSize;
    @Value("${async.executor.thread.max_pool_size}")
    private int maxPoolSize;
    @Value("${async.executor.thread.queue_capacity}")
    private int queueCapacity;
    @Value("${async.executor.thread.name.prefix}")
    private String namePrefix;
 
    @Bean(name = "asyncServiceExecutor")
    public Executor asyncServiceExecutor() {
        log.warn("start asyncServiceExecutor");
        //在这里修改
        ThreadPoolTaskExecutor executor = new VisiableThreadPoolTaskExecutor();
        //配置核心线程数
        executor.setCorePoolSize(corePoolSize);
        //配置最大线程数
        executor.setMaxPoolSize(maxPoolSize);
        //配置队列大小
        executor.setQueueCapacity(queueCapacity);
        //配置线程池中的线程的名称前缀
        executor.setThreadNamePrefix(namePrefix);
        // rejection-policy：当pool已经达到max size的时候，如何处理新任务
        // CALLER_RUNS：不在新线程中执行任务，而是有调用者所在的线程来执行
        executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());
        //执行初始化
        executor.initialize();
        return executor;
    }
}

创建异步线程业务类

@Service
@Slf4j
public class AsyncServiceImpl implements AsyncService {
@Override
    @Async("asyncServiceExecutor")
    public void executeAsync(List<LogOutputResult> logOutputResults, LogOutputResultMapper logOutputResultMapper, CountDownLatch countDownLatch) {
        try{
            log.warn("start executeAsync");
            //异步线程要做的事情
            logOutputResultMapper.addLogOutputResultBatch(logOutputResults);
            log.warn("end executeAsync");
        }finally {
            countDownLatch.countDown();// 很关键, 无论上面程序是否异常必须执行countDown,否则await无法释放
        }
    }
}

创建多线程批量插入具体业务方法

@Override
public int testMultiThread() {
    List<LogOutputResult> logOutputResults = getTestData();
    //测试每100条数据插入开一个线程
    List<List<LogOutputResult>> lists = ConvertHandler.splitList(logOutputResults, 100);
    CountDownLatch countDownLatch = new CountDownLatch(lists.size());
    for (List<LogOutputResult> listSub:lists) {
        asyncService.executeAsync(listSub, logOutputResultMapper,countDownLatch);
    }
    try {
        countDownLatch.await(); //保证之前的所有的线程都执行完成，才会走下面的；
        // 这样就可以在下面拿到所有线程执行完的集合结果
    } catch (Exception e) {
        log.error("阻塞异常:"+e.getMessage());
    }
    return logOutputResults.size();
}

模拟2000003 条数据进行测试

多线程测试 2000003 耗时如下：耗时1.67分钟

本次开启30个线程，截图如下：

单线程测试2000003 耗时如下：耗时5.75分钟

检查多线程入库的数据，检查是否存在重复入库的问题：

根据id分组，查看是否有id重复的数据，通过sql语句检查，没有发现重复入库的问题

检查数据完整性：

通过sql语句查询，多线程录入数据完整

测试结果

不同线程数测试：

总结

通过以上测试案列，同样是导入2000003 条数据，多线程耗时1.67分钟，单线程耗时5.75分钟。通过对不同线程数的测试，发现不是线程数越多越好，具体多少合适，网上有一个不成文的算法：

CPU核心数量*2 +2 个线程。

附：测试电脑配置

来源：azdebug.blog.csdn.net/article/details/103697108


到此文章就结束了。Java架构师必看一个集公众号、小程序、网站(3合1的文章平台，给您架构路上一臂之力)。如果今天的文章对你在进阶架构师的路上有新的启发和进步，欢迎转发给更多人。欢迎加入架构师社区技术交流群，众多大咖带你进阶架构师，在后台回复“加群”即可入群。


这些年小编给你分享过的干货

0.ChatGPT 4o 国内直接用 ！！！
1.idea2024.1.4永久激活码（亲测可用）
2.优质ERP系统带进销存财务生产功能（附源码）
3.优质SpringBoot带工作流管理项目（附源码）
4.最好用的OA系统，拿来即用（附源码）
5.SBoot+Vue外卖系统前后端都有（附源码）
6.SBoot+Vue可视化大屏拖拽项目（附源码）

转发在看就是最大的支持❤️

http://mp.weixin.qq.com/s?__biz=MzAwNzMyMTcxMg==&mid=2453094348&idx=1&sn=87cb3d577cf36113a6999402ac05557a

Java架构师必看

致力于分享优质文章及教程【java程序员从初级到中级进阶Java高级架构师】;搜集全网高质量学习书籍面试题视频项目;让您系统提升java架构技术,关注回复『1024』获取Java编程资源,共学习,共进步。

最新文章

千万级数据的全表update的正确姿势

入职第一天，看了公司代码，牛马沉默了

还在手动配置Nginx？太LOW了，这个超强大的 Nginx 可视化管理工具太牛逼了！

3个完美替代 Navicat 的工具，香！

中国研发部门一锅端，IBM程序员上千人一夜被裁！

用了 6 年的Spring Boot 项目部署方案！打包 + Shell 脚本部署详解，稳的一批!

SpringBoot+Minio实现上传凭证、分片上传、秒传和断点续传(通用版)

性能爆表：SpringBoot利用ThreadPoolTaskExecutor批量插入百万级数据实测！

2人自建平台盗链影视作品狂赚3.92亿，结果3年起刑

为啥大公司的 SpringBoot 项目都不用 Tomcat

危险！请马上替换代码中的BeanUtils！！！

阿里领导：手下两个应届生，一个踏实喜欢加班，一个技术强挑活，怎么选？

公司发声明了！禁止所有程序员使用 Lombok ！再使用绩效直接打C！

Spring Boot+Netty+Websocket实现后台向前端推送信息

这个Git 客户端炸了：腾讯自研，免费了！

工作流引擎 Activiti 保姆级教程

30年，软件架构过时了吗？

一个高性能、支持百万级多任务重试框架：Fast-Retry

90后程序员自学开发搞黄色网站赚50万，结果悲剧了

项目分层开发中，真的有必要定义 VO 吗？

如何使用 Java 读取 Excel、docx、pdf 和 txt 文件？

效率爆表！EasyExcel合并单元格这样实现才是yyds

saveBatch()、自定义批量插入、多线程批量插入性能对比，差别巨大啊~！

SpringBoot项目jar包防反编译加密指南

SpringBoot + Prometheus：打造高效监控系统

基于微服务和DDD的架构模板

终极 Nginx 配置指南（全网最详细）

盘点 Lombok 中的那些整活儿骚操作

MySQL 中 Varchar(50) 和 varchar(500) 区别是什么?

自己动手写个 IDEA 高效插件：Swagger注解、JavaDoc一键生成

不想被恶意访问？SpringBoot 的 IP 白名单限制了解一下！

雷军做程序员时写的博客，很强大！

为什么 B 站的弹幕可以不挡人物？

Java线上开发神器：10秒实现代码热更新

VSCode无敌秘籍！一键百行代码的配置，告别痛苦的重复代码

JetBrains全家桶2024首个大版本更新

“仅相差 8 个字节，整个生产环境竟崩溃了！”

SpringBoot 服务启动慢排查思路

ChatGPT 4o 直接用，太爽了！！！

工商银行取得新专利：基于Spring Boot的Web系统后端实现方法及装置

放弃老旧的Mybatis，强类型替换字符串，这款ORM框架很强！！！

吓哭了，看片被派出所问候了...

一万八千条线程，线程为啥释放不了？

全球第二大成人网站——OnlyFans一年赚66亿美金，远超Pornhub、比AI创业公司都挣得多

57岁前员工怒删公司备份、搞瘫3000+台电脑，勒索532万元未遂被捕！网友：怀疑他是被裁的

解锁 SpringBoot 的强大配置功能

优雅的实现接口防刷，最强方案来了~！

史上最全，全方位阐述 SpringBoot 中的日志是怎么工作（珍藏版）

玩转 Spring 状态机：更优雅的实现订单状态流转

轻松搞定分布式 Token 校验，完美！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉