(本文转载于阿里云)
在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B
Qwen2.5 模型支持高达 128K tokens,可生成最多 8K tokens的内容。旗舰模型Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等权威测评中表现出色,在多个核心任务上,以不到1/5的参数规模超越了Llama3.1的4050亿参数开源模型。
2024云栖大会首日重点速览
今天上午,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在2024云栖大会上发表主题演讲。
过去22个月,AI发展速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
通往AGI的大模型发展之路
生成式AI重塑自动驾驶
第二场圆桌对话聚焦大模型在自动驾驶里面的落地进展。
小鹏汽车董事长 CEO何小鹏表示,自动驾驶发展了许多年,只能做到特定场景,比如高速上开或者城市里开。因为它是通过算法人工写规则,一个人无法用规则去面对世界上所有的场景。但端到端的大模型帮助我们提升未来自动驾驶的高度,且拉高下限。到未来的36个月,可以让我们每一个人在每一个城市都像老司机一样开车。
同时,小鹏汽车董事长 CEO何小鹏驾驶“全球首款AI汽车”P7+亮相2024云栖大会,这款车搭载了业内领先的端到端大模型。过去2年,小鹏汽车与阿里云共建的AI算力规模提升超4倍。何小鹏表示,将继续深化与阿里云的AI算力合作,加速推动端到端大模型拓展自动驾驶上限,提升下限。
人形机器人的“图灵时刻”
第三场圆桌对话主题是人形机器人的“图灵时刻”,探讨人形机器人这类物理智能载体,在大模型带动下所发生的变化。
逐际动力创始人张巍认为:“这一代AGI的发展,相比上一代最大的区别,从专用到通用的一个变化。在大模型出来之前,我感觉通用这个词是个贬义词,通用就证明它是没什么用。但是大模型出来以后,大家发现像以前我们这种在专业领域里搜数据、去做专项任务的这种训练的方式是有很大局限性的,要先构建一个通用的基础模型的能力,然后再在上面长出专用的能力,这才是系统化解决泛化性的一个关键。我觉得软件算法的通用性就靠大模型技术,机器人跟物理世界交互的这个通用性,就靠人形机器人”。
北京大学助理教授,北大-银河通用具身智能联合实验室主任、智源学者王鹤表示:“现在的通用机器人,虽然有一些技能,但几乎都是分立的一些小模型。大模型赋能这些技能有几步:第一步是大模型可以作为一个Agent来调用这些API进行长程的任务规划,第二步是大模型可以作为一个Monitor,它看小模型执行过程中有没有出任何错误,及时去终止或者调用别的技能来挽救这些错误,比如药盒掉到地上了,它立马说“你得给它捡起来”;第三步则是最有想象力的端到端,Vision、Language、Action,把动作作为大模型输出的模态,像自动驾驶一样,我们实现一个把通用感知、通用规划或通用执行融为一体的大模型”。
清华大学交叉信息研究院助理教授、星动纪元创始人陈建宇表示:“人形机器人技术分成三大块,就是大脑、小脑和本体。这里面最关键的,我个人认为是小脑的层面,它承接大脑的你的思考、调用硬件本体,真正能帮助我们到这个世界里面干活的。现在人形机器人小脑部分相比于其他几个部分反而是最薄弱的,同时也是技术的不确定性最高的,最没有收敛的。我们希望人形机器人这个小脑,希望它的双腿能够像人一样的又稳又快又灵活,能够帮助我们达到任何一个地方去,我们希望它的双手能够帮助我们上的厅堂、下的厨房,进得工厂,什么都能够去干,做非常灵巧的事情”。
宇树科技创始人、CEO王兴兴对于机器人应用落地表示相对乐观态度,表示:“我觉得到明年,人形机器人在一些固定场景做一些有商业价值的落地应用,基本上问题不大。我个人还是相对乐观,我觉得3年左右,至少全球范围内,有通用型的机器人AI出来的概率还是很大的一件事情。因为跟过去10年不一样,现在整个机器人AI的人才、资金投入都是巨量,都是几百倍甚至上千倍的投入,所以整个时间进展会比较快”。
通义大模型全面升级
通义大模型宣布年度升级。通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。
通通义千问三款主力模型再降价
继5月首次大幅降价后,阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%,低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,可应用于复杂任务,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus性价比达到业界最高,同等规模较行业价格低84%。同时,阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度。
打造最强AI大基建
AI驱动阿里云全系列产品家族升级。最新上线的磐久AI服务器,支持单机16卡、显存1.5T,并提供AI算法预测GPU故障,准确率达92%;阿里云ACS首次推出GPU容器算力,通过拓扑感知调度,实现计算亲和度和性能的提升;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;阿里云CPFS文件存储,数据吞吐20TB/s,为AI智算提供指数级扩展存储能力;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。
开放最先进的大模型
阿里云作为业内最早布局大模型技术的科技公司之一,去年4月发布首个大语言模型通义千问,如今通义大模型家族已全面涵盖语言、图像、视频、音频等全模态,性能均跻身世界第一梯队,同时通义模型持续开源,已成为最受企业和开发者欢迎的国产大模型。
通义灵码推出全新AI程序员
“我们希望企业和开发者能以最低的成本做AI、用AI,让所有人都能用上最先进的大模型。”阿里云CTO周靖人表示。
2024云栖大会,精彩还在继续
9.19-9.21,持续相约
云栖小镇,不见不散
/ END /
版块介绍 — 产业之声
紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。
推荐阅读
Reading
2、观察|“兼济天下”与“产业繁荣”:从中法联合声明看中国的“AI力”
3、智能背后的电能保障:GPU算力集群能源挑战的全球视角与中国应对
4、产业之声 | 阿里调研:生成式AI在电商场景的应用、前景与挑战
6、阿里云内部全面推行AI写代码,未来20%代码由通义灵码编写
9、安全治理与能力发展兼顾并重,Claude 3对中国大模型发展有哪些启示
10、【“人工智能+”深度案例】从智能工厂到ChatBI,雅戈尔的“智能+”实践
14、《自然·医学》刊登中国科学家关键突破:癌症筛查的黄金时代准备就绪
16、【观点】阿里妈妈万相实验室首发上线 电商进入AI上新新时代
20、产业之声 | 为AI供电-超万卡GPU算力集群的算电协同与零碳发展
21、产业之声 | “软硬兼施,以软带硬” - 缓解“算力焦虑”的模型与芯片协同优化策略
23、“形”“型”合璧,恰逢其会-人形机器人是大模型技术的高级呈现形态
24、具身智能系列 | 人形机器人会替代机械臂吗?- 人形机器人在制造业中的定位与价值分析
25、产业之声|大模型问月:首个月球科学多模态专业大模型发布
- END -