算力补贴累计超亿元!模速空间“浓缩”上海大模型产业链

2024-11-11 13:59   中国香港  


为何这里跑出众多大模型尖子生?

作者/  IT时报记者  孙妍 贾天荣

编辑/  钱立富  孙妍

编者按

瞧,一幅数字新图景正绽放!


在全国首个大模型创新生态社区——模速空间,基于“双万兆接入暨一跳入算服务”,AI企业在进行模型训练时可一跳直达临港智算中心,营商环境不断优化。


于千行百业,于千家万户,“智云上海”构筑了高效、智能、普惠的信息服务生态系统,为推动上海成为具有世界影响力的国际大都市注入澎湃动力。

2023年3月,陈冉毅然奔入大模型创业浪潮,创立了开放传神,想做线上线下一体的HuggingFace+开源社区。彼时,ChatGPT横空出世不久,便已在全球刮起生成式人工智能旋风,算力风暴随即到来。2023年5月,一家清华系AI创业公司无问芯穹成立,想做AI算力界的安卓,打破算力生态竖井问题。


2023年9月,模速空间在上海徐汇区揭牌,成为全国首个大模型创新生态社区。“上下楼就是上下游。”是模速空间里流传甚广的一句话。短短一年时间,无问芯穹、开放传神等百家左右大模型初创企业成了上下楼的邻居,这里也便形成了AI创业磁场,吸引众多创业企业集聚。


模速空间就像是上海人工智能发展的切面,浓缩一条产业链,勾勒一张算力布局蓝图,跑出了多个大模型尖子生。


1毫秒之间,徐汇和临港的物理空间被打破,模速空间大模型企业可以“一跳直达”临港智算中心。“智云上海”之上,算力真正成为像“水电”一样的公共服务产品,用得上、用得起、用得好。算力普惠之下,AI独角兽才能不断从模速空间等生态社区跑出来。



一条浓缩的AI产业链

走进模速空间的一幢楼,就能看到大模型的浓缩版产业链:算力层有无问芯穹、仪电智算等,数据层有库帕思、上海人工智能实验室开源数据平台OpenDataLab等,基础大模型有商汤、MiniMax等,应用层有教育大模型作业帮、能源大模型达卯智能等,平台社区有开放传神等。


“大模型初创企业都会遇到缺算力、缺钱、缺人、缺场景等困难,但最缺的还是生态环境。”模速空间总经理陈海慈强调,模速空间的优势就体现在一句话里,“上下楼就是上下游”。


“上下楼都是我们社区的用户,隔壁邻居可能都是我们的潜在合作对象,这就是一片沃土。”陈冉说道,企业、开发者集聚在一起的生态环境是开源社区最为看重的。


无问芯穹要成为模型层和芯片层之间的桥梁,就需要快速与大模型生态建立连接,于是,模速空间也成为这家清华系AI初创企业落户上海的首选。“算力补贴、房租减免、大模型备案辅导、投融资建议等都是模速空间带给我们实实在在的支持。”无问芯穹相关负责人说道。

京清程极智科技有限公司是一家智能算力系统软件公司,其在上海成立子公司,入驻模速空间三期,就是看中模速空间可以为其提供一个上下游企业互动与协作的理想平台。


“目前中国AI发展最缺的是生态建设,中国互联网之所以成功,就源于产业链思维,这才有了百花齐放,电商领域就有淘宝、京东、拼多多、抖音等多样化的存在。”陈冉认为,国内孵化器可以深度借鉴YC模式,由具备创业经验的创业者当导师,才能帮AI初创企业更好地“把脉”。


开放传神这家线上线下一体的HuggingFace+开源社区已经汇聚近百万开发者,为大模型在垂直行业的应用提供工具平台和解决方案,对训练和推理算力的需求都较大,所以它的算力使用量是模速空间最大的几家之一。


创业初期,开放传神采用了海外的云算力和国内某大厂算力,但成本始终居高不下。“我们接触过很多算力服务商,但能提供一站式服务的供应商非常少,上海电信有整体优势。”陈冉表示,大模型的训练时间大大缩短,整体成本降低60%。


近期,开放传神与书生·浦语社区合作,在中国电信位于临港的国产液冷万卡算力池进行训练部署,打通了从数据集获取到模型训练的全链路流程。


降本增效的背后,是上海电信为人工智能企业提供的“一跳入算”服务,从“模速空间”到位于临港新片区的临港智算谷,万兆全光一跳直达,时延低至1ms。


所谓的“一跳入算”就是弹性算力网络,也是上海电信“智云上海”的一个横截面。平日里,上海电信弹性算网可为企业提供基础速率,一旦出现突发性任务、周期性作业急需大带宽传输,当天即可发起动态提速。例如,在100Mbps带宽下,10TB数据需10天才能完成传输,通过“弹性算力网络”升速后,仅需2小时便可完成传输,且企业只需支付2小时费用,至少降低50%的算网使用成本。


构建普惠的算力体系,不仅要让算力像水电一样随取随用,而且要让企业用得上、用得起、用得好算力,于是,模速空间多管齐下,构建公共算力调度平台,发放算力补贴券等。

一张算力布局蓝图

上海是全国最重要的智能计算中心集聚地。上海的AI算力布局规划清晰,东部在临港汇聚,西部在青浦、松江汇聚,每年都保持增长态势。前期采用英伟达算力,让大模型企业先用起来,后期逐步增大国产化规模。


上海电信等运营商是算力建设主力军。早在几年前,上海电信便开始在青浦区和临港新片区前瞻布局“东西两翼”智算中心。今年8月,中国电信临港智算谷1.2期机楼封顶,明年将具备机电、机架进场条件,届时可容纳至少6万卡高端算力集群,标志着10万卡时代即将到来,智算谷终期规划是30万卡高端智算集群。


为了解决算力供给的难题,模速空间搭建了一个公共算力调度平台,对接了电信、联通、移动三大运营商,以及上海仪电、商汤、火山引擎、华为、腾讯、阿里等算力供应商。


在走访多家模速空间入驻企业时,大家都会提到算力补贴券。陈海慈透露,为了让AI初创企业用得起算力,模速空间已帮入驻企业申请超亿元的算力补贴券,其中包括7000万现金。


中科加禾母公司在外地,但选择入驻模速空间,虽在今年3月完成数千万元的天使轮融资,但对初创企业来说,算力成本可能要占到一半以上。其负责人向《IT时报》记者坦言,“我们能够通过自身能力获取算力资源,但成本仍然是一大负担。入驻模速空间能够为我们提供基础设施支持,特别是公共资源的优惠政策,有效降低了运营成本”。


为了让算力更好用,无问芯穹这位“卖铲人”用自研技术实现了多种大模型算法在多元芯片上的高效协同部署,它还搭了一个“大模型超市”——Infini-AI异构云平台,用异构算力为开发者提供性价比较高的算力和原生工具链。


无问芯穹也是首批入驻模速空间的企业,“从7人到超百人,模速空间都快装不下它了。”陈海慈笑着说道。

在2024世界人工智能大会上,无问芯穹联合创始人兼CEO夏立雪发布了全球首个千卡规模异构芯片混训平台,混训算力利用率最高可达97.6%。无问芯穹已经完成多个主流开源大模型在AMD、华为昇腾、壁仞等10余种计算卡上的适配,并在部分计算卡上实现了行业第一的推理加速成果。


无问芯穹想做的是大模型时代的算力运营商。目前,中国电信、中国联通等电信运营商,以及大型国央企都是无问芯穹在全国多地合作的算力建设与运营战略伙伴。生数科技、智谱AI、Kimi、LiblibAI、猎聘等都近20家大模型企业都在其异构云平台上使用异构算力,或使用无问芯穹提供的大模型开发工具链。


我们接触了多个数据中心,其中国产卡大多有一定占比,异构算力混训的需求很大,我们现在能做到异构混训性能损失在5%以内。”无问芯穹相关负责人向《IT时报》记者表示,如何让国产芯片成为第二选择是当下上海乃至全国算力发展的重点,算力触达实体经济,有人买单,应用落地,产业链闭环才能形成。


夏立雪站在2024世界人工智能大会的舞台上说:“我们的目标是让大模型落地成本降低10000倍,如同水电煤等基础设施一样,打开水龙头前,我们不需要知道水从哪条河来的。同理,未来我们打开各种AI应用时,也不用知道它调用了哪些基座模型,用到了哪种加速卡的算力,这就是最好的AI基础设施。”

多个大模型尖子生

上海汇聚了全国三分之一的AI人才,成为大批顶级专家和青年英才归国创新创业的首选城市。而坐落于上海徐汇西岸的模速空间正在打造全国人工智能高地,被称为中国“AI六虎”的6家大模型独角兽中,上海徐汇占据两个,即稀宇科技(MiniMax)和阶跃星辰。


无问芯穹是模速空间跑出的AI潜力独角兽,成立仅一年4个月就融资近10亿元,最新一轮融资中,投资方出现了不少国资基金的身影。


在模速空间一周年之际,上海市生成式人工智能创新生态先导区在徐汇西岸揭牌,核心便是模速空间。同时,100亿元上海人工智能生态基金落户徐汇区,首期30亿元。“首期意向投资10个项目,两个基模型,8个都是模速空间的企业。”陈海慈向《IT时报》记者透露。


在模速空间,金融服务平台以上海人工智能母基金、徐汇资本等为牵引,建立覆盖种子期、成长期、成熟期的全链条科创投体系,徐汇资本及其出资人工智能领域基金已投103个项目,坚持投早投小,投资A轮及以前早期项目数量占比88%;上海首个大模型合规指导服务中心已累计服务全市超300家企业全生命周期健康发展。

 

除了生态和算力外,融资、备案辅导、场景等都是吸引大模型初创企业入驻模速空间的因素。


“羚数智能正在进行垂直领域模型的备案。传统上,这类备案需企业自行与市网信办沟通层层推进,过程复杂。但模速空间引入了市网信办的驻点服务,简化了备案流程,大幅提升了工作效率。”工业垂直模型羚数智能联合创始人陈启明向《IT时报》记者介绍道。


深思考创始人兼CEO杨志明也向《IT时报》记者强调了模速空间的聚集效应,这一效应还体现在模速空间能对接多元化应用场景,使大模型技术在垂直领域快速落地,还能在算法、数据等方面提供实质性帮助。


在陈海慈看来,选择尖子生来入驻,光形成一条完整的产业链是不够的,后期还有算力、融资、备案、场景等一系列孵化工作,跟互联网时代商业模式创新不同的是,人工智能更需要创新范式的变革。


真正的“智云上海”,是要打破生态之间的传输壁垒,为整座城市的智慧跃迁提供底座。算力普惠,算网提速,让每家AI初创企业用得上、用得起、用得好,是AI范式变革的第一步,也是重要一步。

排版/  季嘉颖

图片/  IT时报

来源/《IT时报》公众号vittimes

E N D



传神社区
该账号是开放传神(OpenCSG)分享大模型的技术、见解、传神开放社区等方面的内容!
 最新文章