10分钟手撸一款线程安全的高性能通用缓存组件！

文摘 2024-06-10 08:21 四川

大家好，我是冰河~~

在实际工作中，有一种非常普遍的并发场景：那就是读多写少的场景。在这种场景下，为了优化程序的性能，我们经常使用缓存来提高应用的访问性能。因为缓存非常适合使用在读多写少的场景中。

在并发场景中，Java SDK中提供了ReadWriteLock来满足读多写少的场景。本文我们就来说说使用ReadWriteLock如何实现一个通用的缓存中心。

本文涉及的知识点有：

读写锁

说起读写锁，相信小伙伴们并不陌生。总体来说，读写锁需要遵循以下原则：

一个共享变量允许同时被多个读线程读取到。
一个共享变量在同一时刻只能被一个写线程进行写操作。
一个共享变量在被写线程执行写操作时，此时这个共享变量不能被读线程执行读操作。

这里，需要小伙伴们注意的是：读写锁和互斥锁的一个重要的区别就是：读写锁允许多个线程同时读共享变量，而互斥锁不允许。所以，在高并发场景下，读写锁的性能要高于互斥锁。但是，读写锁的写操作是互斥的，也就是说，使用读写锁时，一个共享变量在被写线程执行写操作时，此时这个共享变量不能被读线程执行读操作。

读写锁支持公平模式和非公平模式，具体是在ReentrantReadWriteLock的构造方法中传递一个boolean类型的变量来控制。

public ReentrantReadWriteLock(boolean fair) {
    sync = fair ? new FairSync() : new NonfairSync();
    readerLock = new ReadLock(this);
    writerLock = new WriteLock(this);
}

另外，需要注意的一点是：在读写锁中，读锁调用newCondition()会抛出UnsupportedOperationException异常，也就是说：读锁不支持条件变量。

缓存实现

这里，我们使用ReadWriteLock快速实现一个缓存的通用工具类，总体代码如下所示。

public class ReadWriteLockCache<K,V> {
    private final Map<K, V> m = new HashMap<>();
    private final ReadWriteLock rwl = new ReentrantReadWriteLock();
    // 读锁
    private final Lock r = rwl.readLock();
    // 写锁
    private final Lock w = rwl.writeLock();
    // 读缓存
    public V get(K key) {
        r.lock();
        try { return m.get(key); }
        finally { r.unlock(); }
    }
    // 写缓存
    public V put(K key, V value) {
        w.lock();
        try { return m.put(key, value); }
        finally { w.unlock(); }
    }
}

可以看到，在ReadWriteLockCache中，我们定义了两个泛型类型，K代表缓存的Key，V代表缓存的value。在ReadWriteLockCache类的内部，我们使用Map来缓存相应的数据，小伙伴都都知道HashMap并不是线程安全的类。

所以，这里使用了读写锁来保证线程的安全性，例如，我们在get()方法中使用了读锁，get()方法可以被多个线程同时执行读操作；put()方法内部使用写锁，也就是说，put()方法在同一时刻只能有一个线程对缓存进行写操作。

这里需要注意的是：无论是读锁还是写锁，锁的释放操作都需要放到finally{}代码块中。

在以往的经验中，有两种向缓存中加载数据的方式，一种是：项目启动时，将数据全量加载到缓存中，一种是在项目运行期间，按需加载所需要的缓存数据。

接下来，我们就分别来看看全量加载缓存和按需加载缓存的方式。

全量加载缓存

全量加载缓存相对来说比较简单，就是在项目启动的时候，将数据一次性加载到缓存中，这种情况适用于缓存数据量不大，数据变动不频繁的场景，例如：可以缓存一些系统中的数据字典等信息。整个缓存加载的大体流程如下所示。

将数据全量加载到缓存后，后续就可以直接从缓存中读取相应的数据了。

全量加载缓存的代码实现比较简单，这里，我就直接使用如下代码进行演示。

public class ReadWriteLockCache<K,V> {
    private final Map<K, V> m = new HashMap<>();
    private final ReadWriteLock rwl = new ReentrantReadWriteLock();
    // 读锁
    private final Lock r = rwl.readLock();
    // 写锁
    private final Lock w = rwl.writeLock();
    
    public ReadWriteLockCache(){
        //查询数据库
        List<Field<K, V>> list = .....;
        if(!CollectionUtils.isEmpty(list)){
            list.parallelStream().forEach((f) ->{
    m.put(f.getK(), f.getV);
   });
        }
    }
    // 读缓存
    public V get(K key) {
        r.lock();
        try { return m.get(key); }
        finally { r.unlock(); }
    }
    // 写缓存
    public V put(K key, V value) {
        w.lock();
        try { return m.put(key, value); }
        finally { w.unlock(); }
    }
}

按需加载缓存

按需加载缓存也可以叫作懒加载，就是说：需要加载的时候才会将数据加载到缓存。具体来说：就是程序启动的时候，不会将数据加载到缓存，当运行时，需要查询某些数据，首先检测缓存中是否存在需要的数据，如果存在，则直接读取缓存中的数据，如果不存在，则到数据库中查询数据，并将数据写入缓存。后续的读取操作，因为缓存中已经存在了相应的数据，直接返回缓存的数据即可。

这种查询缓存的方式适用于大多数缓存数据的场景。

我们可以使用如下代码来表示按需查询缓存的业务。

class ReadWriteLockCache<K,V> {
    private final Map<K, V> m = new HashMap<>();
    private final ReadWriteLock rwl =  new ReentrantReadWriteLock();
    private final Lock r = rwl.readLock();
    private final Lock w = rwl.writeLock();
    V get(K key) {
        V v = null;
        //读缓存
        r.lock();        
        try {
            v = m.get(key);
        } finally{
            r.unlock();    
        }
        //缓存中存在，返回
        if(v != null) {  
            return v;
        }  
        //缓存中不存在，查询数据库
        w.lock();     
        try {
     //再次验证缓存中是否存在数据
            v = m.get(key);
            if(v == null){ 
                //查询数据库
                v=从数据库中查询出来的数据
                m.put(key, v);
            }
        } finally{
            w.unlock();
        }
        return v; 
    }
}

这里，在get()方法中，首先从缓存中读取数据，此时，我们对查询缓存的操作添加了读锁，查询返回后，进行解锁操作。判断缓存中返回的数据是否为空，不为空，则直接返回数据；如果为空，则获取写锁，之后再次从缓存中读取数据，如果缓存中不存在数据，则查询数据库，将结果数据写入缓存，释放写锁。最终返回结果数据。

这里，有小伙伴可能会问：为啥程序都已经添加写锁了，在写锁内部为啥还要查询一次缓存呢？

这是因为在高并发的场景下，可能会存在多个线程来竞争写锁的现象。例如：第一次执行get()方法时，缓存中的数据为空。如果此时有三个线程同时调用get()方法，同时运行到 w.lock()代码处，由于写锁的排他性。此时只有一个线程会获取到写锁，其他两个线程则阻塞在w.lock()处。获取到写锁的线程继续往下执行查询数据库，将数据写入缓存，之后释放写锁。

此时，另外两个线程竞争写锁，某个线程会获取到锁，继续往下执行，如果在w.lock()后没有 v = m.get(key); 再次查询缓存的数据，则这个线程会直接查询数据库，将数据写入缓存后释放写锁。最后一个线程同样会按照这个流程执行。

这里，实际上第一个线程已经查询过数据库，并且将数据写入缓存了，其他两个线程就没必要再次查询数据库了，直接从缓存中查询出相应的数据即可。

所以，在w.lock()后添加 v = m.get(key); 再次查询缓存的数据，能够有效的减少高并发场景下重复查询数据库的问题，提升系统的性能。

读写锁的升降级

关于锁的升降级，小伙伴们需要注意的是：在ReadWriteLock中，锁是不支持升级的，因为读锁还未释放时，此时获取写锁，就会导致写锁永久等待，相应的线程也会被阻塞而无法唤醒。

虽然不支持锁升级，但是ReadWriteLock支持锁降级，例如，我们来看看官方的ReentrantReadWriteLock示例，如下所示。

class CachedData {
    Object data;
    volatile boolean cacheValid;
    final ReentrantReadWriteLock rwl = new ReentrantReadWriteLock();

    void processCachedData() {
        rwl.readLock().lock();
        if (!cacheValid) {
            // Must release read lock before acquiring write lock
            rwl.readLock().unlock();
            rwl.writeLock().lock();
            try {
                // Recheck state because another thread might have
                // acquired write lock and changed state before we did.
                if (!cacheValid) {
                    data = ...
                    cacheValid = true;
                }
                // Downgrade by acquiring read lock before releasing write lock
                rwl.readLock().lock();
            } finally {
                rwl.writeLock().unlock(); // Unlock write, still hold read
            }
        }

        try {
            use(data);
        } finally {
            rwl.readLock().unlock();
        }
    }
}}

数据同步问题

首先，这里说的数据同步指的是数据源和数据缓存之间的数据同步，说的再直接一点，就是数据库和缓存之间的数据同步。

这里，我们可以采取三种方案来解决数据同步的问题，如下图所示

超时机制

这个比较好理解，就是在向缓存写入数据的时候，给一个超时时间，当缓存超时后，缓存的数据会自动从缓存中移除，此时程序再次访问缓存时，由于缓存中不存在相应的数据，查询数据库得到数据后，再将数据写入缓存。

定时更新缓存

这种方案是超时机制的增强版，在向缓存中写入数据的时候，同样给一个超时时间。与超时机制不同的是，在程序后台单独启动一个线程，定时查询数据库中的数据，然后将数据写入缓存中，这样能够在一定程度上避免缓存的穿透问题。

实时更新缓存

这种方案能够做到数据库中的数据与缓存的数据是实时同步的，可以使用阿里开源的Canal框架实现MySQL数据库与缓存数据的实时同步。也可以使用我个人开源的mykit-data框架哦（推荐使用）~~

mykit-data开源地址：

https://github.com/sunshinelyz/mykit-data
https://gitee.com/binghe001/mykit-data

写在最后

在冰河的知识星球除了目前正在热更的高性能网关外，还有其他6个项目，像分布式IM即时通讯系统、Sekill分布式秒杀系统、手写RPC、简易商城系统等等，这些项目的需求、方案、架构、落地等均来自互联网真实业务场景，让你真正学到互联网大厂的业务与技术落地方案，并将其有效转化为自己的知识储备。

值得一提的是：冰河自研的Polaris高性能网关比某些开源网关项目性能更高，你还在等啥？不少小伙伴经过星球硬核技术和项目的历练，早已成功跳槽加薪，实现薪资翻倍，而你，还在原地踏步，抱怨大环境不好。2024年抛弃焦虑和抱怨，我们一起塌下心来沉淀硬核技术和项目，让自己的薪资更上一层楼。

目前，领取5折优惠券，就可以跟冰河一起学习《简易商城脚手架项目》、《手撸RPC专栏》和《Spring6核心技术与源码解析》、《实战高并发设计模式》、《分布式Seckill秒杀系统》、《分布式IM即时通讯系统》和《高性能Polaris网关》，从零开始介绍原理、设计架构、手撸代码。

花很少的钱就能学这么多硬核技术、中间件项目和大厂秒杀系统与分布式IM即时通讯系统，比其他培训机构不知便宜多少倍，硬核多少倍，如果是我，我会买他个十年！

加入要趁早，后续还会随着项目和加入的人数涨价，而且只会涨，不会降，先加入的小伙伴就是赚到。

另外，还有一个限时福利，邀请一个小伙伴加入，冰河就会给一笔 分享有奖 ，有些小伙伴都邀请了50+人，早就回本了！

其他方式加入星球

链接：打开链接 http://m6z.cn/6aeFbs 加入星球。
回复：在公众号 冰河技术 回复星球领取优惠券加入星球。

特别提醒： 苹果用户进圈或续费，请加微信 hacker_binghe 扫二维码，或者去公众号 冰河技术 回复星球扫二维码加入星球。

好了，今天就到这儿吧，我是冰河，我们下期见~~

往期推荐

推荐👍：《历时5个月，分布式IM即时通讯系统完美收官》

推荐👍：《历时5个月，秒杀系统完美收官》

推荐👍：《打开计划启动：每个项目的价值都远超门票》

推荐👍：《从单体到微服务，冰河的秒杀系统上硬菜了》

推荐👍：《用过来人的身份告诉你大厂为何要自研RPC》

推荐👍：《深入理解高并发编程（第2版）发布》

推荐👍：《SpringCloud Alibaba实战电子书发布》

---END---

下方扫码领券限时 5折加入 冰河技术 知识星球，你将获得：SpringCloud Alibaba实战、实战高并发设计模式、手写分布式IM系统（对接ChatGPT），手写秒杀系统，手写RPC、手写调度系统、Spring6源码解析、并发编程、性能调优、框架源码、面经手册等高质量大厂项目和技术小册/PDF等资料。目前，分布式IM即时通讯系统已经完结，分布式高性能网关项目正在热更中，后续会根据星球加入人数和项目完善情况，逐步涨价，点击：查看更多...

知识星球：冰河技术

公众号后台回复“并发编程2”领取《深入理解高并发编程（第2版）》电子书。回复 “并发编程” 领取冰河原创的全网累计下载超70W+的《深入理解高并发编程（第1版）》电子书。回复 “渗透笔记” 领取冰河原创的全网首个开源的以实战案例为背景的《冰河的渗透实战笔记》电子书。回复 “PDF” 领取冰河整理的其他8本超硬核PDF电子书，海量面试资料和简历模板。

冰河从一名普通程序员，一路进阶成长为互联网资深技术专家，TVP腾讯云最具价值专家，一直致力于分布式系统架构、微服务、分布式数据库、分布式事务、大数据以及云原生技术的研究。在高并发、高可用、高可扩展性、高可维护性、大数据以及云原生等领域拥有丰富的架构经验。希望我的经验能够为你带来帮助。

公众号：冰河技术

视频号：冰河技术

喜欢就点个 在看 呗 👇

冰河技术

分享各种编程语言、开发技术、分布式与微服务架构、分布式数据库、分布式事务、云原生、大数据与云计算技术和渗透技术。另外，还会分享各种面试题和面试技巧。

最新文章

如何设计一个支持千万级用户同时在线的短视频系统？

你管这破玩意儿叫Redis虚拟内存？

造轮子：这个造轮子手册和视频开源了！

用自己写的IM系统与好友视频是种什么感受？

2024年最后一次免费送书！！！

这次是该涨价了！！！！！

先更新数据库，还是先更新缓存？效果还真不一样！！！

一本书，50万！！！！！！

高并发环境下诡异的加锁问题：明明加了锁，但还是出错了！

003_从零开始自研手写企业级RPC核心注解设计与编码实现

造轮子：这个投产的自研手写框架视频上线了！

002_从零开始自研手写企业级RPC整体架构设计

Java多次启动一个线程究竟会发生什么？程序到底会不会崩？大部分程序员理解错误！！

RPC视频：第01章从零开始自研手写企业级RPC整体介绍和章节布局

自己手写RPC如何实现同步、异步、单向调用？直接上代码！！

我宣布：高性能网关项目正式上线，嘎嘎强！

11月初，我做了一项重大决定！

如何实现亿级流量下的分布式限流？这些理论你必须掌握！！

领书了！！！

实战 | 手把手教你搭建一套大厂都在用的私服仓库

从实战角度聊聊JVM调优的几种场景（建议收藏）

3个月面试近300人，发现大部分人回答不出来这道题的重点！

竟然还有人使用这个有Bug的JDK！

国庆第二天手写网关上高性能通用熔断组件！

还有谁没学过这个项目？涵盖：高并发、高性能、高可用、全链路压测、异地容灾...

又一个小而美的涵盖多个实际场景的高并发项目完结了

14张图深度解密大厂秒杀系统库存设计，不是所有的库存都能支持高并发！

商城项目底层通信成功整合自己手写的轮子是种什么感受？

这个前端+后端+OpenAI的项目，就该这么写简历！

又一个高性能网关项目已经成型，嘎嘎强！

又偷偷写了一个新项目，以实战角度聊聊用到的核心技术

以过来人的经验：写给正处于迷茫期的小伙伴们！

写了个工具，完美破解了MySQL！！

死鬼，学完RPC，你竟然还要我写Dubbo！

三万字：架构+源码深度解析分布式锁架构原理与实现方案（冰河带你一步步手写分布式锁）

高可用的巅峰技术：跨机房部署、同城双活、异地多活究竟怎么玩儿？

生产环境大面积404，这锅我不背！

这个框架很强，这本书也是免费送！

网站刚上线就被攻击了！

1个月，肝了本实战小册，免费送给大家

超级加倍：互联网大厂的容灾架构设计与落地方案（跨机房部署、同城双活、异地多活）

造轮子：这个手把手教你造轮子的手册开源了！

自己造的轮子被投产使用是种什么感受？

造轮子：大厂为何都要自研API网关？

高并发场景下到底应该创建多少线程？

有没有并发编程经验，一问这个类便知！

我要用Go再写一遍这套最强高并发系统！

10分钟手撸一款线程安全的高性能通用缓存组件！

互联网大厂的缓存策略：抵抗超高并发的秘密武器，已开源！

这套IM即时通讯系统准备上云部署开放使用了！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉