springboot第75集：kafka，线程，进程，容器化服务，线程池

科技 2024-10-06 19:28 广东

消息中间件在异步通信中⽤的最多，很多业务流程中，如果所有步骤都同步进⾏可能会导致核⼼流程耗时⾮常⻓，更重

要的是所有步骤都同步进⾏⼀旦⾮核⼼步骤失败会导致核⼼流程整体失败，因此在很多业务流程中Kafka就充当了异步

通信⻆⾊。

⼤规模分布式系统中的机器⾮常多⽽且分散在不同机房中，分布式系统带来的⼀个明显问题就是业务⽇志的查看、追踪

和分析等⾏为变得⼗分困难，对于集群规模在百台以上的系统，查询线上⽇志很恐怖。

为了应对这种场景统⼀⽇志系统应运⽽⽣，⽇志数据都是海量数据，通常为了不给系统带来额外负担⼀般会采⽤异步上

报，这⾥Kafka以其⾼吞吐量在⽇志处理中得到了很好的应⽤。

随着据量的增加，离线的计算会越来越慢，难以满⾜⽤户在某些场景下的实时性要求，因此很多解决⽅案中引⼊了实时

计算。

很多时候，即使是海量数据，我们也希望即时去查看⼀些数据指标，实时流计算应运⽽⽣。

实时流计算有两个特点，⼀个是实时，随时可以看数据；另⼀个是流。实时流计算有两个特点，⼀个是实时，随时可以看数据；另⼀个是流。

push模式由broker决定消息推送的速率，对于不同消费速率的consumer就不太好处理了。

消息系统都致⼒于让consumer以最⼤的速率最快速的消费消息，push模式下，当broker推送的速率远⼤于consumer消息系统都致⼒于让consumer以最⼤的速率最快速的消费消息，push模式下，当broker推送的速率远⼤于consumer

消费的速率时，consumer恐怕就要崩溃了。

例如消息发送设置了重试机制，并且异步发送，消息A和B设置相同的key，业务上A先发，B后发，由于⽹络或者其他

原因A发送失败，B发送成功；A由于发送失败就会重试且重试成功，这时候消息顺序B在前A在后，与业务发送顺序不

⼀致，如果需要解决这个问题，需要设置参数 max.in.flight.requests.per.connection=1 ，其含义是限制客户

端在单个连接上能够发送的未响应请求的个数，设置此值是1表示kafka broker在响应请求之前client不能再向同⼀个

broker发送请求，这个参数默认值是5

kafka的消息是不断追加到⽂件中的，这个特性使 kafka 可以充分利⽤磁盘的顺序读写性能

顺序读写不需要硬盘磁头的寻道时间，只需很少的扇区旋转时间，所以速度远快于随机读写

Kafka 可以配置异步刷盘，不开启同步刷盘，异步刷盘不需要等写⼊磁盘后返回消息投递的 ACK，所以它提⾼了消息发

送的吞吐量，降低了请求的延时

传统的 IO 流程，需要先把数据拷⻉到内核缓冲区，再从内核缓冲拷⻉到⽤户空间，应⽤程序处理完成以后，再拷⻉回

内核缓冲区内核缓冲区

这个过程中发⽣了多次数据拷⻉

将数据保存到内存中的 Map（或其他数据结构）后，服务重启时这些数据不会自动保留，因为内存中的数据在进程结束时会被清除。要保留数据，可以考虑以下几种方法：

1. 持久化存储

将数据从 Map 持久化到文件或数据库中，以便在服务重启时能够恢复。

a. 使用文件存储

可以将 Map 的数据序列化并写入文件，例如使用 JSON 格式：

import java.io.*;
import java.util.HashMap;
import java.util.Map;

public class DataStorage {
    private Map<String, String> dataMap = new HashMap<>();

    // 保存数据到文件
    public void saveToFile() throws IOException {
        try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("data.ser"))) {
            oos.writeObject(dataMap);
        }
    }

    // 从文件加载数据
    public void loadFromFile() throws IOException, ClassNotFoundException {
        try (ObjectInputStream ois = new ObjectInputStream(new FileInputStream("data.ser"))) {
            dataMap = (Map<String, String>) ois.readObject();
        }
    }
}

// 使用 Redis 的 Java 客户端（如 Jedis）存储 Map 数据
import redis.clients.jedis.Jedis;

// 保存数据到 Redis
public void saveToRedis() {
    try (Jedis jedis = new Jedis("localhost")) {
        for (Map.Entry<String, String> entry : dataMap.entrySet()) {
            jedis.set(entry.getKey(), entry.getValue());
        }
    }
}

// 从 Redis 加载数据
public void loadFromRedis() {
    try (Jedis jedis = new Jedis("localhost")) {
        for (String key : jedis.keys("*")) {
            String value = jedis.get(key);
            dataMap.put(key, value);
        }
    }
}

定期将 Map 中的数据快照保存到文件或数据库中，以便在服务重启时快速恢复。

在服务启动时，添加加载数据的逻辑，从持久化存储中读取数据并填充 Map。

内存中的数据（如 Map）在重启时不会保留。
通过文件存储、数据库、或内存数据库等方法将数据持久化，可以在服务重启时恢复数据。

举例：单次拉取11条消息，每条消息耗时30s，11条消息耗时5分钟30秒，由于 max.poll.interval.ms 默认值5分

钟，所以消费者⽆法在5分钟内消费完，consumer会离开组，导致rebalance。

在消费完11条消息后，consumer会重新连接broker，再次rebalance，因为上次消费的offset未提交，再次拉取的消

息是之前消费过的消息，造成重复消费。

1、提⾼消费能⼒，提⾼单条消息的处理速度；根据实际场景可讲 max.poll.interval.ms 值设置⼤⼀点，避免不必

要的rebalance；可适当减⼩ max.poll.records 的值，默认值是500，可根据实际消息速率适当调⼩。

2、⽣成消息时，可加⼊唯⼀标识符如消息id，在消费端，保存最近的1000条消息id存⼊到redis或mysql中，消费的消

息时通过前置去重。

消费者内部根据线程数量创建等量的内存队列，对于需要顺序的⼀系列业务数据，根据key或者业务数据，放到同⼀个

内存队列中，然后线程从对应的内存队列中取出并操作

org.apache.kafka.clients.producer.ProducerInterceptor 接⼝。

该接⼝是Kafka提供的，⾥⾯有两个核⼼的⽅法。

onSend：该⽅法会在消息发送之前被调⽤。
onAcknowledgement：该⽅法会在消息成功提交或发送失败之后被调⽤。onAcknowledgement的调⽤要早于

callback的调⽤。值得注意的是，这个⽅法和onSend不是在同⼀个线程中被调⽤的，因此如果你在这两个⽅法中

调⽤了某个共享可变对象，⼀定要保证线程安全

在服务器上，进程和线程的产生通常与应用的运行模式和用户请求有关。以下是一些常见情况：

1. 进程

服务启动时：当后端服务（如 web 服务器、数据库等）启动时，操作系统会为其创建一个进程。
进程间通信：如果需要通过进程间通信（IPC）来处理任务，可能会启动新的进程。

2. 线程

多线程服务：在多线程应用中，服务会在启动时创建多个线程，准备处理并发请求。
用户请求处理：当用户请求接口时，后端服务通常会为每个请求分配一个线程来处理，从而提高响应能力。

3. 请求接口时的具体行为

单线程模式：在单线程服务中，所有请求可能会在同一个线程中排队处理。
多线程/进程模式：在多线程或多进程模式下，当一个请求到达时，可能会立即生成一个新的线程或进程，或者从线程池中借用一个现有的线程。

4. 异步处理

一些现代框架采用异步处理方式，通过事件循环和回调机制来处理请求，减少线程或进程的使用。

在服务器中启动多个服务时，通常会产生多个进程。以下是一些具体情况：

1. 每个服务一个进程

独立服务：大多数后端服务（如 web 服务器、数据库等）会以独立进程的形式运行。每个服务启动时，操作系统会为其分配一个新的进程。
资源隔离：进程之间相互独立，具有自己的内存空间，有助于提高安全性和稳定性。

2. 多线程服务

服务内部的多线程：一些服务可能内部实现为多线程结构，服务的每个进程可以包含多个线程来处理并发请求。这种情况下，服务的进程数量和线程数量是分开的。
线程池：在一些高性能服务中，可能会使用线程池来管理线程，以便复用已有的线程来处理请求，减少线程创建和销毁的开销。

3. 容器化服务

容器化：在使用 Docker 等容器技术时，通常每个服务在不同的容器中运行，每个容器也是一个独立的进程。这种方式可以方便地管理和扩展服务。

总结

启动多个服务时，通常是产生多个进程。
每个服务进程内部可以使用多线程来处理并发请求。

确保 replication.factor > min.insync.replicas ，如果两者相等，那么只要有⼀个副本挂机，整个分区就

⽆法正常⼯作了，我们不仅要改善消息的持久性，防⽌数据丢失，还要在不降低可⽤性的基础上完成，推荐设置

成 replication.factor = min.insync.replicas + 1 。

加群联系作者vx：xiaoda0423

仓库地址：github.com/webVueBlog/…

算法猫叔

程序员：进一寸有一寸的欢喜

最新文章

springboot第84集：Java进阶之路, Netty

springboot第83集：理解SaaS多租户应用的架构和设计，设备介入，网关设备，安全，实时实现，序列化

springboot第82集：消息队列kafka，kafka-map

微服务mysql，redis，elasticsearch, kibana，cassandra，mongodb, kafka

springboot第80集：Seata，优化 Java 代码，物联网IOT

springboot第79集：各种锁，线程池企业级高并发亿级数据处理

springboot第78集：队列，锁，并发，通信，框架，流计算

springboot第77集：深入浅出Java多线程

springboot第76集：线程，ThreadGroup

springboot第75集：kafka，线程，进程，容器化服务，线程池

springboot第74集：设计模式

感谢关注 Thanks for your attention

升职，熬出头了，部门负责人成功拿下！

计算机专业大学生必读的『经典书单』

springboot第72集：字节跳动全栈二面经，一文让你走出微服务迷雾架构周刊

springboot第71集：字节跳动全栈一面经，一文让你走出微服务迷雾架构周刊

springboot第70集：字节跳动后端三面经，一文让你走出微服务迷雾架构周刊

springboot第69集：字节跳动后端二面经，一文让你走出微服务迷雾架构周刊

springboot第68集：字节跳动后端一面经，一文让你走出微服务迷雾架构周刊

springboot第67集：字节跳动三面经，一文让你走出微服务迷雾架构周刊

springboot第66集：字节跳动二面经，一文让你走出微服务迷雾架构周刊

springboot第65集：字节跳动一面经，一文让你走出微服务迷雾架构周刊

springboot第64集：Netty的底层实现机制，熟练运用群集，一文让你走出微服务迷雾架构周刊

springboot第63集：Netty，docker，elasticsearch，kibana一文让你走出微服务迷雾架构周刊

springboot第62集：JAVA-NIO聊天群组挑战，一文让你走出微服务迷雾架构周刊

springboot第61集：Jenkins-Boss万字挑战，一文让你走出微服务迷雾架构周刊

springboot第60集：架构师万字挑战，一文让你走出微服务迷雾架构周刊

springboot第59集：面试官万字挑战，一文让你走出微服务迷雾架构周刊

springboot第58集：Dubbo万字挑战，一文让你走出微服务迷雾架构周刊

springboot第57集：Redis万字挑战，一文让你走出微服务迷雾架构周刊

springboot第56集：微服务框架，物联网IOT，SQL数据库MySQL底层，AOP收集业务操作日志架构周刊

六个提升编程内功的项目：简易商城、RPC、Spring6源码、秒杀系统、并发设计模式、即时通讯系统

springboot第55集：思维导图Sharding-JDBC，事务，微服务分布式架构周刊

springboot第54集：思维导图后端知识点微服务分布式架构周刊

springboot第53集：微服务分布式架构，docker-compose，Prometheus，mqtt监控体系周刊

springboot第52集：微服务分布式架构，统一验证，oauth，订单，地区管理周刊

springboot第51集：lombok，Swagger，k8s，缓存，sentinel周刊

springboot第49集：【思维导图】多线程，常用类与基础API，集合框架，泛型，数据结构源码

springboot第50集：File类，IO流，网络编程，反射机制周刊

springboot第48集：【思维导图】地图，面向对象，异常，功能代码

轨迹回放

springboot第46集：Nginx，Sentinel，计算机硬件的介绍

springboot第47集：【思维导图】面向对象，关键字，标识符，变量，数组的使用

024年开发者必试的17款Chrome效率提升插件

springboot第45集：微服务iot与小程序关联

【蚂蚁】简述 browserslist 的意义

【字节】介绍 CSS 隐藏页面中某个元素的几种方法

【滴滴】如何压缩前端项目中 JS 的体积

【美团】http 响应头中的 ETag 值是如何生成的

【字节】前端如何对分支环境进行部署

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉