SAIL观察 | 大模型淘金热下,卖铲or卖水哪个更赚?

科技   科技   2024-11-07 19:26   上海  

扫码登录【云平台

观看更多WAIC 2024精彩



大模型掀起的 AI 新浪潮,激荡着全球科技创新领域的每一寸水域,无数创新技术和应用场景随之涌现。


这是大模型创业者的黄金时刻,对于大模型生态而言,同样也是一次难得的机遇。有人选择加入这场淘金盛宴,深入AI大模型的深水区,挖掘出前所未有的应用价值;也有人选择做金矿边的卖铲人,淘金客的卖水人,我们称他们为大模型“生态构建者”



在2024年的SAIL奖申报项目中,大模型产品占比13.47%,而大模型生态(含技术底座)项目占比15.54%,而在TOP30榜单中,大模型生态获奖项目高达7个,大模型获奖项目仅有阶跃星辰Step系列通用大模型、智谱基座大模型GLM。

项目数量和获奖数量的双重反超,似乎显示出一种信号:大模型生态构建者们所耕耘的领域,正逐渐成为科技创新的新焦点,推动着大模型的浪潮向着更为广阔和深邃的方向奔腾而去。





“百模大战”鏖战正酣 卖铲人先赚一波



正如卖铲人在淘金热中成为最大赢家,在大模型时代,驱动AI发展的“三驾马车”——算力、算法、数据也扮演着类似的角色。


若论哪个最重要,可能大多数人都会投算力一票,毕竟,从国产算力荒、算力紧缺到供需错位、利用效率低下,大模型的发展一直处于“算力焦虑”的阴影之下。


一个朴素而有效的破局路径是,通过集群互联实现算力资源利用效率的最大化。近年来,各地政府已经紧锣密鼓地建设AI算力中心,而产业端也同样不甘落后,头部运营商、各大算力厂商都已加速布局大规模智算集群。


今年SAIL奖TOP30中,北京基流科技提出了“超大规模智算集群设计与实践”,基于英伟达的软硬件生态,构建了两个超大规模智算集群,集群上线初期无故障运行超过3天,并提升集群的有效算力超过600TFlops,保障高效率、高可靠性的深度学习模型训练;


基流科技供图


临港算力“中国电信临港智算中心”,据悉该项目已正式启用国内首个国产单池万卡液冷算力集群,创新性地采用网络中置、算力分层的“魔方”型,满足万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求。


中国电信临港智算中心


在缓解算力紧缺焦虑上,今年斩获SAIL大奖来自上海人工智能实验室的DeepLink人工智能开放计算体系扮演了一个非常特殊的角色。


DeepLink在AI生态中的位置


在大模型生态系统中,DeepLink是适配硬件芯片与深度学习软件框架的中间层桥梁,提炼通用的芯片计算能力,向下打通芯片适配,向上适配训练、推理框架来支持算力应用,支持大模型在内的训练和推理应用于硬件芯片上。同时针对大模型训练场景,突破多维度并行、长文本和自适应训练技术,显著提升训练能效,从软、硬件两方面共同助力人工智能技术突破。


据介绍,DeepLink已与昇腾、寒武纪、沐曦、燧原科技、壁仞科技、天数智芯、中科海光等10余家硬件企业展开合作,完成了实验室语言大模型书生·浦语的推理适配。在应用上,DeepLink已与商汤科技、仪电集团、电信天翼云等多家应用企业就软硬件适配、芯片评测、产品化集成等维度展开合作。


DeepLink项目视频


随着大模型进一步演进,“三驾马车”的资源配置情况正在一点点发生改变。数据的重要性日益凸显,毕竟优质数据越多,模型效果越好,数据已经成为决定大模型优劣的差异化关键变量。

大模型时代究竟需要怎样的AI数据库?今年同样位列SAIL大奖MyScale AI数据库交出了自己的答卷。


当下,大语言模型早已不再局限于纯文本数据,但传统数据库只能处理机器容易处理的、如字符串等结构化数据,而非结构化数据,如文本、图片、视频等,虽然信息密度高,但并没有固定的模型或格式,处理效率低,缺乏标准性,无法简单地使用SQL等查询语言进行处理


MyScale供图

而MyScale AI数据库采用多尺度向量/图索引算法作为非结构化数据的运算基础,这些算法能够有效地处理非结构化数据,提高其处理效率并通过多级存储保证AI数据库的高性能、高数据密度和高性价比。并通过提供一个统一的框架,将结构化数据、文本以及非结构化数据(即向量)管理、检索相融合,在同一个数据库中为用户提供统一的多模态数据管理和查询能力。

据介绍,自MyScale AI数据库开始商业化以来,已经服务了来自全球数十个国家的上百个企业用户,如新华社、科大讯飞、中国联通、亚马逊云科技、西门子、IBM、北京科学智能研究院等。


MyScale AI数据库项目视频





大模型最佳辅助 平台服务商“摆摊卖水”



大模型的角斗场上,没有人是天生的开发者,但人人都可能成为开发者,这个曾经的设想正被一群向淘金客卖水的聪明人实现。他们手中掌握着大量的预训练模型,就像拥有无数装满水的皮囊,随时准备为那些在大模型开发征途上的人们解渴助力。


如果你是一名工程师,想要一款个性化的定制级的大模型或应用程序,那么你可以直接在大模型商店里挑选零部件,基于大模型开发自己想要的应用,甚至直接调用预训练好的可用模型,无需二次开发。


比如今年SAIL之星——魔搭ModelScope,类似大模型领域的Github,它提供了大量高质量的开源模型与工具,将研发成果最大程度地惠及社区,基于模型训练、模型部署、模型调用等基础服务,魔搭ModelScope孵化了基础大模型、行业大模型15000余个,可应用于Agent、文档问答、语音助手、数字人、智能搜索RAG等应用生态场景。


魔搭ModelScope平台架构


此外,魔搭ModelScope也为开发者提供易于使用模型的工具,如模型管理工具、数据处理工具、模型微调工具、模型评估工具等。还开源了丰富多元的数据资源,如针对中文大模型安全治理的数据集、面向大模型SFT微调的中文数据集、服务于多模态大模型微调的图文对数据集、以及其他涵盖多语言、小语种文字和语音数据集等。


据了解,魔搭ModelScope社区用户已超700万,是国内规模最大的模型社区。


魔搭ModelScope项目视频

如果还想再进一步降低开发门槛,今年SAIL大奖得主——施耐德电气的EcoStruxure AI Module无疑为开发新手们打开了另一扇便捷之门。


施耐德电气自主研发的EcoStruxure AI Module是企业级一站式AI建模与运维平台,通过组件式组合的方式,不仅集成了身份认证、数据管理、AI建模、AI模型模版配置、AI模型商店多个功能模块,而且针对能源管理和工业自动化领域预置了多个成熟的AI模型模版,方便通过编辑配置文件,快速落地已经在行业内验证过的算法模型,可以帮助企业以低成本的方式,快速验证AI算法的合理性和实际效果。


EcoStruxure AI Module组件式开放架构


EcoStruxure AI Module相比传统的AI开发平台,具备在能源管理和工业自动化领域多年的行业积累,数十个已经被实际生产环境验证后的AI模型模版方便不同水平的用户(包括非软件开发的技术人员),也能轻松开启AI模型实现节能减排和智能化运维的大门,在AI世界里游刃有余的探索和创新。

EcoStruxture AI引擎项目视频




一个商人在沙漠的单行道上修一座加油站赚了钱,周围立刻多了十几座加油站,结果大家都玩完儿。但是第二个开了家旅馆,第三个人开了个披萨店,第四个人开了个超市……久而久之这里就会成为一个繁华的商业区。

大模型生态和这个故事非常相似的地方在于,封闭的竞争只会陷入内卷的僵局,当这个生态愈发繁荣之时,每一个细微之处都将被滋养,每一个企业,无论是专注于技术底座、模型开发,还是应用落地、生态平台,都能在这片肥沃的土壤中找到自己的盈利点。



关于SAIL奖


卓越人工智能引领者(SAIL)奖是世界人工智能大会的最高奖项荣誉,自 2018年创办以来,坚持“追求卓越、引领未来”的理念,发掘全球领先的具有高度认可和美誉、并提升人类福祉的人工智能项目,旨在激励技术突破、应用创新和治理探索,引领智能变革。


2025 SAIL 申报或推荐


傅老师 18616964005

sail@worldaic.com.cn





点击阅读原文观看WAIC 2024精彩

世界人工智能大会
聚焦人工智能行业前沿,跟踪世界人工智能大会信息
 最新文章