华为数据存储参与共建以KV-Cache为中心的推理架构Mooncake

科技 2024-11-28 16:56 广东

在大模型时代，更多的数据、更大的模型、更长的上下文窗口带来了更高的智能，但也对大模型推理系统的效率提出了更高的挑战。如何应对高推理负载、降低推理成本、降低响应延迟成为业界共同面临的难题。

在今年6月，月之暗面Kimi和清华大学MADSys实验室联合发布了Kimi智能助手底层的Mooncake推理系统的设计思路。该系统基于以KV-Cache为中心的PD分离和以存换算架构，大幅度提升了推理吞吐，受到了业界广泛的关注。

为了进一步加速该技术框架的应用与推广，月之暗面Kimi和MADSys实验室联合华为数据存储等业界代表厂商和9#AISoft等科研团队，结合产学研多方的力量共同发布开源项目Mooncake，共建以KV-Cache为中心的大模型推理架构。

11月28日，该技术框架已正式开源上线（https://github.com/kvcache-ai/Mooncake）。

Mooncake开源项目从论文延伸，以超大规模KV-Cache缓存池为中心，通过以存换算的创新理念大幅度减少算力开销，显著提升了推理吞吐量。本次开源将采用分阶段的方式，依次开源其中的关键组件并集成对于各类不同上层训推框架的支持。

作为AI数据基础设施服务商，华为数据存储在此开源架构中对其中推理框架、Transfer Engine和高性能内存型存储进行扩展与增强。快速构建起 “上层生态+中间算法插件+下层AI存储”的框架方案，形成大模型推理架构最佳实践，基于开源的生态和插件，众多的存储厂商都可以遵循相同的标准接入，通过高性能存储的大范围全局共享与持久化KV-Cache能力，实现高性价比的以存换算推理加速，帮助以KV-Cache为中心的大模型推理架构具备长期记忆能力。

此架构目前应用于广泛使用的推理框架vLLM、MindIE上，通过以存换算的技术，可大幅提升推理性能。未来，华为数据存储会更深层次的参与Mooncake与清华大学MADSys实验室项目的共建，协同产学研力量共同推动产业共建大模型时代下的高性能内存型存储系统。

点击阅读原文，了解更多华为数据存储资讯！

http://mp.weixin.qq.com/s?__biz=MzAwMzY0NDAxMw==&mid=2247584503&idx=2&sn=52367c479e55f35f94396a5cbb29f69b

华为数据存储

海纳数据，释放平凡数据的不凡潜力

最新文章

联通云×华为：让“通智超”一体化算力像水电一样随取随用

华为数据存储参与共建以KV-Cache为中心的推理架构Mooncake

华为DCS AI全栈解决方案，加速行业数智化

华为eKitStor品牌开放日：华为M.2 SSD重新定义DRAM-less高端体验

华为全联接大会欧洲站丨AI时代最佳数据基础设施，加速欧洲企业数智化转型

Cantian引擎和open-eBackup备份软件携手亮相第二届开放原子大赛天津宣讲会

华为提出医疗多模态人工智能数据基础设施建设思考

天津港集团联合华为为智慧码头带来新“码力”

华为数据存储助力湖北银行打造NAS双活容灾标杆！

华为黄涛：构建先进AI存储，助力AI大模型高质量发展

华为数据存储助力光大银行数据库一体机摘得“金融科技发展奖”

华为OceanStor闪存存储、Cantian引擎与联通在线uniDB数据库完成兼容性测试认证！

TB级数据两分钟恢复！微众银行联合华为搭建新一代灾备系统

ModelEngine使能医疗大模型创新，加速医疗智能化

华西医院联合华为数据存储发布“华西黉医”医学大模型

贵安存力中心暨数据要素汇聚中心荣获第二届华彩杯算力大赛全国总决赛一等奖

华为存储多层联动勒索攻击防护方案荣获“最佳网络安全解决方案金奖”

共筑数据存储产业，推进数字经济繁荣 | 华为出席数据存储专业委员会成立大会

60万奖金池！第二届开放原子大赛open-eBackup/Cantian两大赛项火热开启

智赋数安，共筑未来 | 以存储构筑数据安全最后一道防线

华为面向分销市场发布HUAWEI eKitStor SSD盘类新品

OceanClub技术社区线上平台发布，构建全球存储人的技术家园

华为发布教育与医疗存储解决方案，助力商业市场客户加速数智化转型

华为数据存储中东中亚创新中心正式成立，助力客户和伙伴加速数据业务创新

GITEX GLOBAL 2024丨华为推出新一代全闪数据中心，加速全场景数智化发展

存算分离架构助力金融业数据库行稳致远

GITEX GLOBAL 2024丨华为发布新一代OceanStor Dorado全闪存存储，助力中东中亚非洲企业加速数智化转型

祝贺！华为OceanDisk智能盘框荣获“算力强基行动卓越产品”称号

共赢算力新时代｜华为亮相2024中国算力大会

周跃峰：打造存算网协同的算力基础设施，为世界提供更好选择

数字金融安全大会 | 构筑金融数据安全最后一道防线

Cantian存储引擎亮相2024开放原子开源生态大会

安徽电信基于Cantian引擎的数据库存算分离创新案例正式发布

AI-Ready领先数据基础设施，加速运营商迈入数智时代

华为AI存储荣获2024年MLPERF™ AI基准测试性能全球第一

华为数据存储联合大华股份发布自动驾驶数据闭环平台解决方案

全场景数据保护，护航数智化时代

中国移动联合华为发布超大规模集群AI存储解决方案

华为数据存储与多家伙伴签署MOU，推进DME IQ伙伴合作新篇章

华为宣布open-eBackup备份软件正式开源，开启数据备份新纪元

华为数据存储携手华傲数据共同发布数据要素流通解决方案

15大联合解决方案发布，共建AI-Ready的领先数据基础设施

持续创新，DCS构筑领先的虚拟化数据中心底座

华为数据存储联合联通云发布面向通智超一体化的全场景存储最佳实践

华为发布全新一代DME IQ 2.0云端智能管理平台

华存智谷携手华为，唤醒数据，深入探索数据存储领域新边界

华为发布《金融数据存储顶层目标架构白皮书》

华为数据存储联合三大数据库厂商发布存算分离解决方案，共筑国产数据库新未来

华为发布HDBS Pro创新方案，以极致性能助力金融核心业务再升级

闪存普惠，一步到位！数据存储商业市场伙伴分论坛圆满落幕

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉