全球首发！华为正式官宣：7月18日，新品正式发布！

体娱 2024-07-18 09:50 北京

7月18日消息，华为云官方宣布“全球首个面向大模型推理的华为云多级KV Cache缓存系统论文入选计算机系统领域顶会。”华为携华为云EMS团队的杰出研究成果CachedAttention亮相美国加州圣克拉拉召开的计算机系统领域顶会USENIX ATC 2024，华为聚焦计算机系统领域，引发业界关注。HarmonyOS NEXT正式版目前已经正式开启先锋测试，备受关注的华为Mate70首发搭载！纯血鸿蒙原生游戏光遇手游，将在ChinaJoy与大家见面！

华为全新新品华为云大模型推理多级KV Cache缓存系统计划是继华为鸿蒙系统全新新品HarmonyOS NEXT鸿蒙星河版开发者预览版Beta新品计划中的核心新品计划！USENIX ATC作为聚焦计算机系统领域的顶级国际会议，自1992年创办以来，已走过了32年的辉煌历程。华为云EMS团队的杰出研究成果《Cost-Efficient Large Language Model Serving for Multi-turn Conversations with CachedAttention》成功被顶会收录。计算机系统领域顶会共收到488篇投稿，经过严格的评审，最终仅77篇论文被录用，录用率仅为15.8%。

华为云多级KV Cache缓存系统论文提出了一种全新的解决方案，解决大型语言模型（LLM）在多轮对话中推理效率低下、成本高昂的问题。通过引入多级KV Cache缓存系统AttentionStore，实现大模型推理过程中的KV Cache复用，降低首Token时延（TTFT）。展开来讲就是华为CachedAttention技术通过维护一个分层的KV Cache存储系统AttentionStore，利用DRAM和SSD等经济高效的存储介质。通过分层预加载和异步保存方法，华为CachedAttention将KV Cache访问与NPU计算重叠，减少从慢速介质上访问KV Cache的开销。

华为CachedAttention采用一个调度程序感知的Fetch和Evict方法，根据推理作业调度程序的提示，有意识地在不同层中进行KV Cache的放置。华为全新策略确保要访问的KV Cache始终被放置在最快的存储层次上，进一步提升推理性能。针对LLM上下文窗口溢出导致KV Cache失效的问题，华为团队巧妙地将位置编码解耦，并有效截断KV Cache，使得即使上下文窗口溢出，保存的KV Cache依然能够保持有效。保证在多轮对话中能够持续重用KV Cache，从而大幅降低推理成本。

传统的推理过程中，大型语言模型需要对每一个输入的Token进行复杂的计算，导致推理速度的降低和计算资源的浪费。CachedAttention技术的核心思想在于，通过缓存之前计算过的注意力权重，避免在推理过程中重复计算相同的注意力矩阵，从而提升推理速度。华为云多级KV Cache缓存系统实验结果表明，华为CachedAttention技术显著降低高达87%的大模型推理首Token时延（TTFT），并提升Prefill阶段7.8倍的吞吐量。降低端到端推理成本的同时为大型语言模型在多轮对话场景中的应用提供技术支撑。

华为云大模型推理多级KV Cache缓存系统的成功发布并入选计算机系统领域顶级国际会议，人工智能与深度学习技术已成为推动科技发展的核心动力，对话机器人、内容创作等领域展现出巨大的应用潜力，彰显华为云在人工智能和计算机系统领域的卓越实力，助力中国科技力量在全球技术竞赛中的领先地位。

http://mp.weixin.qq.com/s?__biz=MzA5MDQwMjY1Mg==&mid=2650593679&idx=1&sn=f5d54fe3fa189212e6ce0dba88351cd5

手机测评

手机测评——专业、有趣的科技新媒体。每天为您推送科技数码产品资讯和大家交流科技圈的信息。随时了解手机测评的动向，第一时间观看我的测评视频。

最新文章

华为Mate70，无烬星河！9月4日焕发新生，全量适配！

华为Mate70，超凡先锋！9月3日鎏金新生，硬钢苹果！

华为Mate70，机械革命！9月2日萌新报到，全系真旗舰！

华为Mate70，锋芒尽显！9月1日新生来袭，真全面屏手机！

华为Mate70，重返帝国！8月31日全球新款，超越苹果！

小米新机突然公布：iPhone 16硬钢小米 15，真英雄！

华为Mate70，新品领衔！丨9月24日，秋季新品发布会！

全球首发！华为突然官宣：8月28日，新品正式发布！

买手机为什么不建议华为mate70？内行人说出了实话！

华为Mate70，新增重磅功能丨8月26日新品发布会！

华为全新新品，8月25日，全球首发829项技术专利！

8月24日，华为Mate70，打工人好贵！

华为Mate70，麒麟绝唱！丨8月23日，华为新机官宣：正式开售！

华为Mate70，倍道兼行！丨8月22日新品首发，4nm工艺制程！

华为Mate70，揭竿而起！丨8月21日新品发布，高性能电竞屏！

华为Mate70，摧坚克难！丨8月20日新品官宣，1.8亿像素！

华为Mate70，三军夺气！丨8月19日新机开卖，Ultra量产版！

华为Mate70，胜敌益强！丨8月18日新机开售，古铜色钛金属！

华为Mate70，奇正相生！8月17日新机来袭，重启直屏时代！

华为Mate70，谋定天下！丨8月16日新机来了，均衡旗舰大战！

华为Mate70，英雄觅处！丨8月15日新机发布，中高端手机+全系涨价！

华为Mate70，先遣区亮相！丨8月14日新品来袭，Deco圆形镜头+超声波指纹！

华为Mate70，争锋赛季！丨8月13日，华为新机官宣：正式开售

华为Mate70，顶级配置丨富士康量产关键期

华为Mate70，全新处理器公开丨300W全球最快闪充发布会！

华为全球首款三折叠屏手机，来了？余承东，55岁生日快乐！

8月8日，华为新机全球首发！打工人用不起

8月7日，华为，全量领导者！科技突围战！

8月6日，华为，远远超越！美国第一，还是中国第一？

8月5日，华为Mate 70，打工人吃不起了！

8月4日，华为见证发布Cantian首个伙伴版本Klustron

华为8月2日最新消息，这也太牛了吧！

就在刚刚，华为全新新品，8月1日，好浪漫！

华为突然官宣 :7月30日，新品正式发布！全球布局！

全球首发！华为新品发布：7月25日，引发业界关注！

全球首发！华为正式官宣：7月24日，新品正式发布！

全球首发！华为新品官宣：7月23日，再破巅峰！

华为突然官宣 :7月22日，新品正式发布！全球布局！

全球首发！华为正式官宣：7月20日，新品正式发布！

全球首发！华为全新新品，7月19日，华为再夺第一！

全球首发！华为正式官宣：7月18日，新品正式发布！

全球首发！华为新品发布，7月17日，全球国际市场！

全球首发！华为正式官宣：7月16日，新品正式发布！

华为突然官宣 :华为斩获全球大奖！7月14日，新品正式发布！

全球首发！华为新品发布，7月13日，战略发布！

华为孟晚舟发声：全面智能化战略！9月19日，华为全新新品！

全球首发！华为正式官宣：7月10日，新品正式发布！

全球首发！华为全新新品，7月9日，业界首发！

全球首发！华为新品官宣，7月8日，全球部署！

全球首发！华为新品发布，7月7日，引发业界关注！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉