推理性能提升10倍，成本下降一半！第四范式发布大模型推理加速卡、推理框架

文摘科技 2024-03-18 18:06 北京

为破解大模型推理中GPU显存瓶颈，第四范式发布了大模型推理框架SLXLLM以及硬件版本的推理加速卡4Paradigm Sage LLM Accelerator（简称SLX）。通过多任务共享存储及处理优化技术，大模型推理性能提升10倍；在模型效果无损情况下，同样使用8张24G显存GPU对6B/7B大模型进行FP16推理，可部署的模型数量从8增至16，GPU利用率从55%最高提升至100%，推理成本仅为原来的一半。值得一提的是，该能力也将集成在4Paradigm Sage AIOS 5.0中，推动大模型落地应用。

当前，业界公认的大模型推理主要瓶颈之一是GPU显存瓶颈。同算力一样，显存是衡量GPU性能的关键指标之一，用于存储计算结果、模型参数等数据。在大模型推理的过程中，往往因为显存受限，导致GPU的算力无法被“全部激活”用于推理过程，GPU算力利用率较低，大模型推理成本居高不下。

为此，第四范式发布了大模型推理框架SLXLLM以及推理加速卡SLX，在二者联合优化下，在文本生成类场景中，大模型推理性能提升10倍。例如在使用4张80G GPU对72B大模型进行推理测试中，相较于使用vLLM，第四范式使用SLXLLM+SLX的方案，可同时运行任务数量从4增至40。此外，推理加速卡SLX也可兼容TGI、FastLLM、vLLM等主流大模型推理框架，大模型推理性能提升约1-8倍。

http://mp.weixin.qq.com/s?__biz=MzU5MDAwMjM5MQ==&mid=2247492716&idx=1&sn=f17abc7ab33ad9e1035164730a1a014a

第四范式

第四范式成立于2014年9月，致力于以AI决策驱动企业智能化转型，解锁企业高效增长和竞争力智能跃迁，驱动经营质变。

最新文章

第四范式发布智能会议解决方案，让会议更高效、更智能

第四范式与睿思智联达成战略合作，联合研发AI算力池化产品RiseVAST

第四范式发布智能鼠标解决方案，打造一站式智能办公全家桶

第四范式发布大模型工具链产品，加速企业大模型应用落地

第四范式发布AI Data Foundry，加速大模型训练及应用

第四范式发布全新一代文档数字化管理平台Smart Archive 2.0

第四范式发布AIGS Builder企业级软件重构助手，以生成式AI重构企业软件

第四范式戴文渊出席2024年中非合作论坛北京峰会开幕式

第四范式先知AIOS 5.2：集成全球先进大模型，提供最优算力服务及推理性能

第四范式与商务印书馆联合推出专业出版级翻译服务

第四范式2024中期业绩：稳健增长，让AI为千行万业带来无限价值

第四范式发布AI+5G视频营销产品助力精准获客与高效转化

第四范式联合创始人陈雨强上榜2024年《财富》中国40岁以下最具潜力商界精英

商务印书馆旗下万邦同和与第四范式成立联合实验室，共建学术出版专业大模型

第四范式发布 AIGS CodeX 企业级编程助手研发产能成倍提效

《习近平与大学生朋友们》| 习书记鼓励我争做自主创新的『排头兵』

第四范式上线搜广推一体化平台赋能企业高效增长

第四范式发布先知AIOS 5.1，升级支持GPU资源池化功能

第四范式数字人平台上线：1小时定制专属数字人

第四范式华东总部开业为打造世界人工智能产业群贡献力量！

2024 WAIC｜用“人工智能+”提升千行百业竞争力

2024 WAIC｜第四范式签约上海徐汇加速推动“人工智能+千行百业”

2024 WAIC｜第四范式胡时伟分享通往AGI之路：行业大模型汇聚成海

山东港口与第四范式签署战略合作协议

戴文渊回上海交大：回首的意义，是激励我继续求索

戴文渊首篇高考作文：AI对生存的终极拷问

第四范式Q1业务进展：驰而不息用科技锻造不朽价值

行业大模型：“人工智能+千行百业”的新基础设施

第四范式发布首份ESG报告：AI能提产效，更可以守卫生命传承文明

Predict the Next “X” ，第四范式发布先知AIOS 5.0

第四范式2023全年业绩：营收人民币42.0亿元同比增长36.4%，行业大模型为千行万业赋能

推理性能提升10倍，成本下降一半！第四范式发布大模型推理加速卡、推理框架

李强总理在京座谈，第四范式戴文渊就发展新质生产力发言

国家发展改革委主任郑栅洁调研人工智能产业发展，第四范式受邀交流

第四范式与华为等企业联合共建“大模型应用产业联合体”

第四范式入选2023中国人工智能大模型企业综合竞争力榜单

第四范式「式说」大模型通过国家备案

全国人大常委会副委员长郝明金率队开展AI专题调研戴文渊陪同调研

「式说」入选MIT中国AI大模型先进应用案例

最具投资价值、年度领航企业，多项荣誉加冕！

第四范式生物药物计算成果再次登上《Nature》子刊

市政协副主席、市工商联主席燕瑛走访调研第四范式

共建京港数字产业合作，第四范式创始人兼CEO戴文渊出席京港洽谈会

“范生态”来了！

数字化转型的下一站是？大咖嘉宾在SHIFT 2023上这么说……

20场深度研讨、70位企业决策者，第二届SHIFT数字化转型峰会明日开播！

互联网教父、OpenAI科学家携手20+董事长齐聚，SHIFT 2023首批重磅嘉宾公布

全国工商联成立70周年戴文渊出席庆祝大会

第四范式上市后首份业绩报告：决策式+生成式AI驱动业绩高增长

第四范式在港交所主板正式挂牌上市

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉