作者|王艺
2024年已接近尾声,但人工智能的热度仍未消减。
这一年,Sora的发布引发全球震惊,GPT-4o的多模态能力和OpenAI o1的推理能力震惊世界;英伟达GTC上发布了Blackwell架构的GPU,使用更低成本构建更高量级的算力基础设施成为可能;AI for Science的发展如火如荼,诺贝尔物理和化学奖都颁发给了人工智能相关的科学家,AlphaFold3的发布让人工智能预测生命分子间的相互作用能力更进一步;AI应用遍地开花,从以Character.ai为代表的AI情感陪伴,到以Perplexity为代表的AI搜索,再到以Cursor为代表的AI编程,这些应用不仅展现了AI技术的无限潜力,也预示着一个由AI赋能的美好未来正在加速到来。
这一年,中国的人工智能领域也有不少大事发生:文心大模型的日均调用量超15亿次,通义Qwen2.5-72B的性能超越Llama 405B,再登全球开源大模型王座;智谱GLM-4的整体性能逼近GPT-4,面壁智能端侧模型MiniCPM3.0能力超GPT-3.5;文生视频方面,生数Vidu、快手可灵、字节即梦、智谱清影等神仙打架,智源研究院Emu-3开辟原生多模态大模型新道路;具身智能领域,银河通用、星动纪元、星海图等企业屡获大额融资。产业端,大模型助力了金融、医疗、教育、智能制造等行业的提质增效;消费侧,豆包、Kimi、星野等应用在国内爆火,Talkie、Gauth等则在海外大杀四方。
可以说,人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,不仅在科研探索、技术创新方面引领潮流,更在实际应用中展现出巨大的经济和社会价值。
12月14日,以“创新驱动,智启新程”为主题的中国人工智能大会(CCAI)开幕式在中关村国家自主创新示范区展示中心召开。本届大会由中国人工智能学会主办,北京市科学技术委员会、中关村科技园区管理委员会,北京市海淀区人民政府支持。大会围绕具身智能、端侧模型、科学智能、世界模型和空间智能等热点话题举办7个主旨演讲、1场尖峰对话,18场专题论坛,聚焦国内外人工智能领域十余名中外院士、百余位产学研专家现场分享从技术研究到产业创新的思路和方法。开幕式上发布《北京人工智能产业白皮书(2024)》、《2024年度中关村科学城人工智能全景赋能典型案例》、超节点算力集群创新联合体等重磅成果。
一场人工智能的盛典,正在海淀徐徐拉开序幕。
1.中国人工智能正从拼参数转向拼应用
ChatGPT推出已有两周年,中国的大模型发展到今天,也经历了一个从烈火烹油到回归理性的过程。
近年来,百模大战轰轰烈烈,从语言大模型,到文生视频大模型,再到3D生成大模型,大厂和创业公司们你方唱罢我登场,几乎每隔几个月就会有让人眼前一亮的大模型出现。
大模型能力提升的背后,是各个厂商疯狂的烧钱竞赛。Scaling Law主导下的大模型预训练需要消耗大量的算力和数据,训练一次模型动辄就要花几千万甚至上亿美元,比如GPT-4的训练花了约7800万美元,而Gemini Ultra的训练花了约1.91亿美元。随着中国大模型厂商的估值陆续跨上200亿美元的台阶,国内大模型公司的单次融资规模上升到了50亿元,想要做出更好的模型效果,就需要融更多的资、烧更多的钱。
海量的烧钱之下,盈利却遥遥无期。以OpenAI为例,其2024年的营收预计在35亿-45亿美元之间,但是运营成本却为85亿美元,一年的亏损将近50亿美元;红杉资本报告测算认为,AI企业只有将年营收总和增至6000亿美元,才能支付AI基础设施建设所需要的庞大资金。
也由此,为了获取更多的用户和收入,各大模型厂商不得不打起了打价格战——5月6日,DeepSeek将其DeepSeek-V2模型的token定价为输入1元/百万tokens(0.001 元/千tokens)、2 元/百万tokens(0.002元/千tokens),价格仅为GPT-4-Turbo的近1%;随后,字节将豆包大模型定价为0.0008元/千tokens,阿里将Qwen-Long降价为0.0005元/千tokens,百度和腾讯更是直接宣布模型免费。
但是价格战不可持续。大模型发展到今天,靠继续提升通用大模型性能带来的行业进步已经十分有限,要想继续摘到产业果实,就必须扎根产业场景,这就需要大模型的落地应用。
在大会开幕式上,中国科学院院士、琶洲实验室(黄埔)主任、西安交通大学西安数学与数学技术研究院院长、大数据算法与分析技术国家工程实验室主任、CAAI Fellow徐宗本院士做了题为《大模型的极限理论:解读智能涌现现象》的报告,在报告中他提到,如果一个问题的本质数据是涌现的,那么大模型一定可以解决该问题;假如一个数学领域的问题,限定在一个特定的公理体系之下,且这个问题的数据量是涌现的,那么这就是一个线性问题,大模型可以解决该问题。
CAAI副理事长、中国工程院院士、CAAI/CIE/CAA/CIC/CSF/IET Fellow何友院士作了题为《AI大模型与智能决策》的报告,在报告中,他列举了大模型在自动驾驶、元宇宙、医疗、气象、物流、军事等领域的应用,为大模型与具体行业的结合指明了方向。
然而,当下中国的大模型在落地过程中仍然有很多难点:明确有商业价值的落地场景有限,模型落地的工程化能力不足、行业和场景大模型尚不完善、企业自身对大模型的认知不足等。此外,能否找到愿意为模型能力买单的市场和用户、以及具体交付的能力,也是大模型能否成功落地的重要因素。
这时候,政府的助推,和案例的引领示范作用就很重要。
海淀区就在做这样的事。在中国人工智能大会开幕式上,海淀区发布了《2024年度中关村科学城人工智能全景赋能典型案例》,包括华清未央、生数科技、深势科技等在内的20余家企业入选了案例集。海淀区希望以这样的方式牵引各行业用户聚焦人工智能应用,以更加开放、包容的心态拥抱人工智能时代的技术革新和产业蝶变。
“我们将持续推动人工智能产业化发展,落实全景赋能行动计划,打造国家级AI+教育、AI+法律、AI+文化示范应用场景。集聚具身智能、医药健康等领域,推动人工智能与重点产业深度融合,规模化发展,加快转化为现实生产力。”在大会上,海淀区委书记、中关村科学城党工委书记张革表示。
在开幕式的尖峰对话环节,中国科学院外籍院士、美国国家科学院院士、清华大学讲席教授丘成桐,国务院参事、中国工程院院士、清华大学信息科学技术学院院长戴琼海,京东集团副总裁、京东探索研究院院长、何晓冬,台湾阳明交通大学终身讲座教授、南京应用数学中心副主任林文伟与北京雁栖湖应用数学研究院副院长、研究员邬荣领五位嘉宾一起讨论了AI for Science、AI For Math和Math for AI的问题。
丘成桐表示,现在人工智能发展的主要问题是缺乏理论支撑,做人工智能研究需要找到基本的公理;戴琼海和何晓东也提到,如何用数学的方法表达人工智能、给人工智能更好的解释和发展,进而在产业界中发现更多的规律,是人工智能下一步发展的关键,也是在科研应用中实现从0到1突破的核心。
2.全景赋能更进一步
作为高校和科研机构最密集的地方和全国科技创新中心核心区,海淀区一直以来就非常重视人工智能产业的发展。
2018年11月,北京市科学技术委员会发布了北京智源行动计划,和海淀区政府共同推动成立了北京智源人工智能研究院;2019年5月,海淀区发布了《关于加快中关村科学城人工智能创新引领发展的十五条措施》,旨在强化原始创新能力提升,集中支持关键技术源头创新,鼓励发展早期和长期投资;
2023年6月,海淀区政府印发《关于加快中关村科学城人工智能大模型创新发展的若干措施》通知,在大模型软硬件技术体系、公共算力、数据要素供给、人才引育与国际合作、产业重塑等五个方面给予了支持;2023年9月,海淀区发布了《中关村科学城通用人工智能创新引领发展实施方案(2023—2025年)》,指出要加强人工智能原始创新和前沿研究、推动人工智能大模型创新体系发展、构建通用人工智能活跃创新生态。
随着大模型技术逐渐成熟、开始寻找落地场景,海淀更是在人工智能领域屡出新政,以加大政策扶持力度、优化创新生态环境、强化产学研用深度融合的方式,不遗余力地推动人工智能的产业化发展:
今年4月,在2024中关村论坛年会上,海淀区发布“人工智能创新街区”概念,该街区位于海淀南部具有优越的人工智能资源、国际互动最紧密的53平方公里范围内,将全面搭建通用城市智能底座,并率先在五道口和大钟寺建设两个先导区;6月,海淀区上线了北京人工智能数据运营平台,该平台在实现数据的汇聚管理、处理与加工等功能基础上,能够提供多种模态的数据标注功能,目前已经汇聚超过700万亿字节的通用数据集和4.33万亿字节的行业数据集;今年8月,在原有中关村科学城科技成长基金的基础上,海淀区推出了中关村科学城科技成长二期基金,二期基金由40亿元的母基金和10亿元的直投基金组成,其推出后,中关村科学城科技成长基金规模已经扩容至100亿元,主要投资人工智能产业,科技服务业,医药健康、集成电路、商业航天等战略性新兴产业,以及具身智能、量子、6G等未来产业。
同样是在今年8月,海淀区发布《中关村科学城人工智能全景赋能行动计划(2024-2026年)》(简称“行动计划”),提出了三年内“涌现100个示范引领典型案例”的发展目标。面向社会广泛征集人工智能创新应用,储备一批AI应用案例,覆盖具身智能、智能驾驶、医药健康、智能制造、工业设计、科学研究、教育教学、政务服务等多个领域。
经过近四个月的多轮评选,20个人工智能应用案例入选2024年度中关村科学城人工智能全景赋能典型案例(排名不分先后):
其中,深势科技的“人工智能驱动的科学研究创新示范平台”用人工智能学习微观粒子如电子、原子、分子的运动规律,打造了微观尺度的科学研究和工业研发基础设施,如Bohrium®科研云平台、Hermite®药物计算设计平台、RiDYMO®中成药靶标研发平台及Piloteye™电池设计自动化平台等,赋能了医药、材料、新能源等多个领域公司的发展;
银河通用则通过合成数据的训练让其具身大模型机器人Galbot(G1)拥有了全球领先的泛化物体抓取技术,目前已经实现了抓取随机放置的透明、高光等物体,在工业场景下,Galbot可实现搬运箱体、分拣物品、装载等工作;在零售场景中,Galbot主要承担商品取补货、盘点搬运、门店监控等工作。目前,银河通用已经与奔驰、极氪、美团等企业开展了广泛的场景落地合作,主要聚焦于商业24小时无人场景和工厂、车厂的落地验证上。
据悉,人工智能全景赋能典型案例的发布,是海淀区落实《行动计划》、打造人工智能全景赋能“第一城”的重要举措。下一步,海淀区表示将继续发挥人工智能产业集聚优势,依托人工智能创新街区和创新应用加速器“格物社区”,推动人工智能科技场景落地实践,共创更广领域、更大范围、更远边界的人工智能全场景应用。
3.产业出题,政府搭台,企业答题
除了《人工智能全景赋能典型案例》,在大会上同步发布的,还有《北京人工智能产业白皮书(2024)》(以下简称“白皮书”)。
北京市科委中关村管委会信息科技处处长韩健发布白皮书 图源:北京市科学技术委员会
超节点算力集群创新联合体揭牌仪式,图源:北京市科学技术委员会
(封面图来源:2024中国人工智能大会)
END.