6 个技术点带你理解 Kafka 高性能背后的原理

科技 2024-09-09 17:15 河北

欢迎加入华仔的星球，你将获得: 专属的中间件专栏 / 1v1 提问 / 简历修改指导/ 学习打卡 / 每月赠书 / 社群讨论
《从四大维度开始带你精通 RocketMQ》 已爆肝完毕，基于 RocketMQ 5.1.2 版本进行源码讲解。
《从四大维度开始带你精通 Kafka》 已完结，基于 Kafka 2.8 以及 3.x 版本进行源码讲解。
截止目前，累计输出 500w+ 字，讲解图 2000+ 张，还在持续爆肝中.. 后续还会上新更多项目和专栏，目标是打造地表最强中间件星球，戳我加入学习，已有410+小伙伴加入，已正式启动电商实战项目，结束时会有简历指导包装，需要的抓紧来。
这里说几点，解答一些疑惑，可以认真看下：
1、星球内容只会越来越完善，价格越来越贵，所以需要抓紧来，越早越受益。
2、只筛选认可且支持我的老铁，我不喜欢白嫖怪，尊重别人就是尊重自己。
3、对于星球年费说下，只是到期后新内容看不到，已经更完的内容相当于一次付费永久看。
4、除专栏外，我会提供专属的一对一答疑服务，包括不限于工作中、专栏中遇到的问题，简历修改指的服务等。

大家好，我是华仔。

Kafka 是一款性能非常优秀的消息队列，每秒处理的消息体量可以达到千万级别。今天来聊一聊 Kafka 高性能背后的技术原理。

1 批量发送

Kafka 收发消息都是批量进行处理的。我们看一下 Kafka 生产者发送消息的代码：

private Future<RecordMetadata> doSend(ProducerRecord<K, V> record, Callback callback) {
 TopicPartition tp = null;
 try {
  //省略前面代码
  Callback interceptCallback = new InterceptorCallback<>(callback, this.interceptors, tp);
  //把消息追加到之前缓存的这一批消息上
  RecordAccumulator.RecordAppendResult result = accumulator.append(tp, timestamp, serializedKey,
    serializedValue, headers, interceptCallback, remainingWaitMs);
  //积累到设置的缓存大小，则发送出去
  if (result.batchIsFull || result.newBatchCreated) {
   log.trace("Waking up the sender since topic {} partition {} is either full or getting a new batch", record.topic(), partition);
   this.sender.wakeup();
  }
  return result.future;
  // handling exceptions and record the errors;
  // for API exceptions return them in the future,
  // for other exceptions throw directly
 } catch /**省略 catch 代码*/
}

从代码中可以看到，生产者调用 doSend 方法后，并不会直接把消息发送出去，而是把消息缓存起来，缓存消息量达到配置的批量大小后，才会发送出去。

注意：从上面 accumulator.append 代码可以看到，一批消息属于同一个 topic 下面的同一个 partition。

Broker 收到消息后，并不会把批量消息解析成单条消息后落盘，而是作为批量消息进行落盘，同时也会把批量消息直接同步给其他副本。

消费者拉取消息，也不会按照单条进行拉取，而是按照批量进行拉取，拉取到一批消息后，再解析成单条消息进行消费。

使用批量收发消息，减轻了客户端和 Broker 的交互次数，提升了 Broker 处理能力。

2 消息压缩

如果消息体比较大，Kafka 消息吞吐量要达到千万级别，网卡支持的网络传输带宽会是一个瓶颈。Kafka 的解决方案是消息压缩。发送消息时，如果增加参数 compression.type，就可以开启消息压缩：

public static void main(String[] args) {
 Properties props = new Properties();
 props.put("bootstrap.servers", "localhost:9092");
 props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
 props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
    //开启消息压缩
 props.put("compression.type", "gzip");
 Producer<String, String> producer = new KafkaProducer<>(props);

 ProducerRecord<String, String> record = new ProducerRecord<>("my_topic", "key1", "value1");

 producer.send(record, new Callback() {
  @Override
  public void onCompletion(RecordMetadata metadata, Exception exception) {
   if (exception != null) {
    logger.error("sending message error: ", e);
   } else {
    logger.info("sending message successful, Offset: ", metadata.offset());
   }
  }
 });

 producer.close();
}

如果 compression.type 的值设置为 none，则不开启压缩。那消息是在什么时候进行压缩呢？前面提到过，生产者缓存一批消息后才会发送，在发送这批消息之前就会进行压缩，代码如下：

public RecordAppendResult append(TopicPartition tp,
         long timestamp,
         byte[] key,
         byte[] value,
         Header[] headers,
         Callback callback,
         long maxTimeToBlock) throws InterruptedException {
 // ...
 try {
  // ...
  buffer = free.allocate(size, maxTimeToBlock);
  synchronized (dq) {
   //...
   RecordAppendResult appendResult = tryAppend(timestamp, key, value, headers, callback, dq);
   if (appendResult != null) {
    // Somebody else found us a batch, return the one we waited for! Hopefully this doesn't happen often...
    return appendResult;
   }
            //这批消息缓存已满，这里进行压缩
   MemoryRecordsBuilder recordsBuilder = recordsBuilder(buffer, maxUsableMagic);
   ProducerBatch batch = new ProducerBatch(tp, recordsBuilder, time.milliseconds());
   FutureRecordMetadata future = Utils.notNull(batch.tryAppend(timestamp, key, value, headers, callback, time.milliseconds()));

   dq.addLast(batch);
   incomplete.add(batch);

   // Don't deallocate this buffer in the finally block as it's being used in the record batch
   buffer = null;

   return new RecordAppendResult(future, dq.size() > 1 || batch.isFull(), true);
  }
 } finally {
  if (buffer != null)
   free.deallocate(buffer);
  appendsInProgress.decrementAndGet();
 }
}

上面的 recordsBuilder 方法最终调用了下面 MemoryRecordsBuilder 的构造方法。

public MemoryRecordsBuilder(ByteBufferOutputStream bufferStream,
       byte magic,
       CompressionType compressionType,
       TimestampType timestampType,
       long baseOffset,
       long logAppendTime,
       long producerId,
       short producerEpoch,
       int baseSequence,
       boolean isTransactional,
       boolean isControlBatch,
       int partitionLeaderEpoch,
       int writeLimit) {
 //省略其他代码
 this.appendStream = new DataOutputStream(compressionType.wrapForOutput(this.bufferStream, magic));
}

上面的 wrapForOutput 方法会根据配置的压缩算法进行压缩或者选择不压缩。目前 Kafka 支持的压缩算法包括：gzip、snappy、lz4，从 2.1.0 版本开始，Kafka 支持 Zstandard 算法。

在 Broker 端，会解压 header 做一些校验，但不会解压消息体。消息体的解压是在消费端，消费者拉取到一批消息后，首先会进行解压，然后进行消息处理。

因为压缩和解压都是耗费 CPU 的操作，所以在开启消息压缩时，也要考虑生产者和消费者的 CPU 资源情况。

有了消息批量收集和压缩，kafka 生产者发送消息的过程如下图：

3 磁盘顺序读写

顺序读写省去了寻址的时间，只要一次寻址，就可以连续读写。

在固态硬盘上，顺序读写的性能是随机读写的好几倍。而在机械硬盘上，寻址时需要移动磁头，这个机械运动会花费很多时间，因此机械硬盘的顺序读写性能是随机读写的几十倍。

Kafka 的 Broker 在写消息数据时，首先为每个 Partition 创建一个文件，然后把数据顺序地追加到该文件对应的磁盘空间中，如果这个文件写满了，就再创建一个新文件继续追加写。这样大大减少了寻址时间，提高了读写性能。

4 PageCache

在 Linux 系统中，所有文件 IO 操作都要通过 PageCache，PageCache 是磁盘文件在内存中建立的缓存。当应用程序读写文件时，并不会直接读写磁盘上的文件，而是操作 PageCache。

应用程序写文件时，都先会把数据写入 PageCache，然后操作系统定期地将 PageCache 的数据写到磁盘上。如下图：

而应用程序在读取文件数据时，首先会判断数据是否在 PageCache 中，如果在则直接读取，如果不在，则读取磁盘，并且将数据缓存到 PageCache。

Kafka 充分利用了 PageCache 的优势，当生产者生产消息的速率和消费者消费消息的速率差不多时，Kafka 基本可以不用落盘就能完成消息的传输。

5 零拷贝

Kafka Broker 将消息发送给消费端时，即使命中了 PageCache，也需要将 PageCache 中的数据先复制到应用程序的内存空间，然后从应用程序的内存空间复制到 Socket 缓存区，将数据发送出去。如下图：

Kafka 采用了零拷贝技术把数据直接从 PageCache 复制到 Socket 缓冲区中，这样数据不用复制到用户态的内存空间，同时 DMA 控制器直接完成数据复制，不需要 CPU 参与。如下图：

Java 零拷贝技术采用 FileChannel.transferTo() 方法，底层调用了 sendfile 方法。

6 mmap

Kafka 的日志文件分为数据文件(.log)和索引文件(.index)，Kafka 为了提高索引文件的读取性能，对索引文件采用了 mmap 内存映射，将索引文件映射到进程的内存空间，这样读取索引文件就不需要从磁盘进行读取。如下图：

7 总结

本文介绍了 Kafka 实现高性能用到的关键技术，这些技术可以为我们学习和工作提供参考。

最后最后推荐下四个不错的产品，感兴趣的可以

上车了，这里只吸引同频的人，如果加入几分钟

就直接退出的就不要来了，浪费我的名额。

第一个来自三哥的小报童，仅需 19 元，马上涨

价了，需要的可以扫码加入。

第二个是右导的《中小程序员生存指南》，

仅需 10 元。

他的这个专栏包含：技术、面试、副业，非常

值得一看。

强烈推荐大家看一看，或许对你的整个职业生

涯都有启发。

第三个是右导的《阿里P9:20年职业50个思考与洞察》，

仅需 29.9 元。

他的这个专栏包含：技术、面试、职场、晋升、

管理、职业生涯，什么都有，非常值得一看。

强烈推荐大家看一看，或许对你的整个职业生

涯都有启发。

第四个是我的知识星球，仅需 189 元，限时特惠

赠送老徐避坑星球（139元）+ 我的副业我陪伴

群（39.9），需要的可以扫码加入。

关于星球介绍点击：

后端消息中间件系列权威指南

加入星球的会赠送老徐的副业避坑星球（价值

139），还会送我的副业陪伴群一年（价值

39.9），相当于免费加入我的技术星球。

需要的加入后文末加我好友来领取福利。

（副业是未来必须要做的事情，

可以趁现在早点布局）

需要续费的扫这个，优惠15元

另外必须要注意的是上车的老铁一定要加我微信

好友，拉你们加入星球专属交流群。

http://mp.weixin.qq.com/s?__biz=Mzg3MTcxMDgxNA==&mid=2247509282&idx=1&sn=1e7c6f734fe75d3340cd5d742309d3fc

华仔聊技术

聊聊后端技术架构以及中间件源码

最新文章

分布式锁的实现原理

强烈推荐一位后端架构师，看了他的文章觉得受益匪浅！

字节一面：kafka为什么这么快？

阿里神器 RocketMQ

Redis 性能优化

字节一面：数据库主从架构数据同步方式有哪些？

超 500 万字详解

使用查询分离后从20s优化到500ms

一文带你彻底理解 Kafka、RocketMQ 消息中间件

麻烦不断的分布式缓存

瞧瞧别人家的Controller，那叫一个优雅

再见 EasyExcel ！

基于社区电商场景的高并发实战，太炸裂了！！

聊聊 redo log 与 binlog 之间的那点破事

京东二面：日常工作中，你是如何优化SQL的？

10w 级的并发场景，JVM 有哪些方面值得优化呢？

Redis集群slot迁移改造实践

基于社区电商场景的高并发实战

最后一次通知！！！

如何利用 Redis 实现高并发全局 ID 生成器

深入理解 OpenFeign 的架构原理

瞧瞧别人家的异常处理，那叫一个优雅

华仔技术星球，要涨了！

京东开源的 JD-hotkey，太强大了！！

如何构建高效分布式任务调度系统

阿里神器 Seata

游戏推荐业务中基于sentinel的动态限流实践

彻底理解 Kafka，这一篇文章就够了！！！

分库分表如何管理不同实例中几万张分片表？

Apache Kafka 中的认证、鉴权原理与应用

用这4招优雅的实现Spring Boot 异步线程间数据传递

Seata+TCC 解决分布式事务，真香！

后端程序员必备：15个MySQL表设计的经验准则

面试官：如何设计一个分布式 ID 生成器

京东一面：接口性能优化，有哪些经验和手段

京东二面：如何利用RocketMQ事务消息，来实现分布式事务？比如下单清空购物车的场景

太火了，最后10张。。。

血与泪的教训，盘点我工作几年所踩的坑

阿里社招二面：谈谈你对JUC 中 AQS的理解，用了什么设计模式？为什么它是锁的灵魂？

面试官：数据库的隔离是什么意思？

G1GC深度探索--Young gc耗时持续增长原因分析

去哪儿秒级监控预警落地实践

SpringBoot线程池开发最佳实践！

小红书实战

DDD 的 7 大关键概念

新项目-高并发社区美食电商实战来啦！

一口气搞懂分库分表 12 种分片算法，大厂都在用

阿里限流神器Sentinel夺命连环 17 问？

超 500 万字详解，从零到一带你彻底吃透 Kafka + RocketMQ

6 个技术点带你理解 Kafka 高性能背后的原理

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉