站在 2024 年的技术浪潮之巅,我们见证着一个前所未有的变革时代:具身智能让机器有了“躯体”,大模型则为软件塑造了真正的“大脑”,开源创新持续释放着技术红利。在这场波澜壮阔的智能革命中,开发者正扮演着关键角色,用代码构筑着人类社会的智能未来。
顺应这一历史机遇,第五届 1024 程序员节于 10 月 24 日在世界计算·长沙智谷盛大启幕。这场由湖南省工业和信息化厅、湖南湘江新区管理委员会、长沙市工业和信息化局、长沙信息产业园管委会和 CSDN 联合打造的年度技术盛会,已然成为观察全球技术创新趋势的重要窗口。作为“IT 技术与产业发展的创新风向标”,本届大会联动北京、上海、深圳、杭州、成都、济南、西安、武汉等八大城市,共同打造一场覆盖全国的技术盛宴。
2024 1024 程序员节以“智能应用新生态”为主题,构建岳麓对话、技术英雄会、十多场主题峰会以及赛事、展览、开发者之夜等版块,盛邀 200+ 位国内外技术翘楚共话创新未来,探寻智能时代的发展密码,协力打造中国研发技术的新范式。
岳麓对话作为每届大会的开幕重头戏,此次选定了两大前沿主题:一场由计算机视觉传奇人物、OpenCV 创始人 Gary Bradski 领衔的机器人领域专家天团,以《十问具身智能与机器人》为题剖析智能交互新格局;另一场则邀请到产学研三界的人工智能技术专家,共同围绕大模型技术能力进化、应用场景及产业未来,展开了一场引人深思的《十问 AI 大模型》对话。
聚焦智能新未来,岳麓对话重磅开启
本届岳麓对话上,长沙市委副书记、湖南湘江新区(长沙高新区)党工委书记、岳麓区委书记谭勇,湖南省工业和信息化厅二级巡视员李红亮,湖南湘江新区(长沙高新区)党工委委员、管委会副主任王先民,湖南湘江新区(长沙高新区)党工委委员、党政综合部部长谭海,湖南湘江新区宣传工作部部长、岳麓区委常委、宣传部部长刘雄辉,长沙信产园(长沙高新区麓谷产业园)党工委书记肖勇军,长沙信产园(长沙高新区麓谷产业园)党工委副书记、管委会主任夏河年以及省工信厅、市工信局、新区党政综合部、科技创新和产业促进局、商务和市场监管局和长沙信产园(长沙高新区麓谷产业园)相关负责同志出席活动。
在大模型如火如荼发展的今天,应用落地成为了推动行业进步的关键命题。长沙作为拥有着丰富的产业集群的城市,更是在科技创新方面走在了时代的前沿。北京的大模型生态,则以其强大的研发能力和创新精神,引领着国内乃至国际的人工智能发展趋势。
顺应这一趋势,来自两地的代表共同完成了一场具有里程碑意义的“长沙产业与北京大模型生态拉手仪式”。北京大模型生态代表为北电数智商业化负责人荆慧,硅基流动联合创始人袁进辉,智谱副总裁吴玮杰;长沙产业代表为拓维信息 AI 事业部总经理倪悝,长沙谱蓝网络科技有限公司董事长蔡立,长沙人工智能中心总经理龚锡铭;企业代表为 CSDN 高级副总裁李炯明受邀共启(企业名称按类别及拼音排序)。长沙与北京在人工智能领域的深度合作将为两地产业发展注入新的活力与动力。仪式完成之际,长沙市委副书记、湖南湘江新区(长沙高新区)党工委书记、岳麓区委书记谭勇宣布本届 1024 程序员节正式开幕。
长沙产业与北京大模型生态拉手仪式
首先,中国工程院外籍院士、德国国家工程院院士张建伟进行了视频连线。紧接着,CSDN 创始人&董事长、开放原子开源基金会理事蒋涛在题为《AGI 时代的软件生态》的演讲中指出,我们正在从确定性计算、人工编码、传统交互转向概率计算、机器生成代码和自然语言交互的大模型时代。蒋涛以现场编程演示的方式,展示了新时代程序员的软件开发范式。通过 InsCode 工具,他完全使用自然语言进行编程,体现了从”写代码“到”描述需求“的开发模式革新,不仅让 80 - 90% 的代码可由 AI 生成,更有望让人人都能开发个性化应用,形成新的”全民应用“生态。
蒋涛 CSDN 创始人、董事长,开放原子开源基金会理事
OpenCV 创始人 Gary Bradski 带来 "OpenCV5 and Spatial Intelligence" (OpenCV5 和空间智能)的前沿分享,揭示空间智能的发展前景,以及他对 AGI 的前瞻见解。他提出,空间智能应对标人脑的"WHAT(识别)"、"WHERE(定位)"和"WHY(因果)"三大系统,这三个系统在人脑中是分开但又相互配合的。例如,看到一个杯子倒下(WHAT),我们能判断它的运动轨迹(WHERE),并预测它会摔碎(WHY)。
Gary 强调,OpenCV 将从简单的3D对象检测和定位开始,逐步构建支持物理和因果推理的完整空间智能框架。他期望先实现 WHAT 和 WHERE 的结合,比如让安防系统既能检测到异常物体,又能定位其在 3D 空间中的位置。而更复杂的 WHY 系统,即对物理规律和因果关系的理解,则留待未来发展。
Gary Bradski OpenCV 创始人
华为首席开源联络官、CNCF 基金会董事任旭东以《共筑开发者生态,共赢智能时代》为题,分享生态发展和开源创新的深度洞察。任旭东认为,AI 的发展将迎来开发者增长的下一个爆发期,同时在开源的推动作用下,AI 的生态发展可能更快到达临界点。在此趋势下,华为积极参与全球开源贡献,深耕智能时代下的核心基础软件,构建 AI 领域关键组件,提供一个强大的技术栈和多项开发者激励计划,以支持开发者实现高效的应用开发。任旭东指出,未来开源社区的代码流动性和人才汇聚效应将形成“新质”生产力,促进万亿产业集群的发展。
任旭东 华为首席开源联络官、CNCF 基金会董事
作为长沙新生代程序员的代表,七月在线创始人、七月大模型与机器人技术总负责人周磊登台发声,展现长沙新一代开发者的创新活力。周磊表示,他曾在北京创业八年,2023 年 ChatGPT 大火,令他决定在长沙从零组建大模型项目开发团队,从此开启了他在长沙新的创业故事。在长沙的研究、生活、工作和创业中,他分享了 4 大心得:做研究,不会错失前沿;生活上,不用过于焦虑;工作上,各地办公室整体联动;创业上,见证了公司开拓。
周磊 七月在线创始人、七月大模型与机器人技术总负责人
十问具身智能与机器人,共探人机新交互
从艾伦·图灵(Alan Turing)、罗德尼·布鲁克斯(Rodney A. Brooks)到李飞飞,人类始终在探索着一个根本性的命题:如何赋予机器以类人的感知与认知能力。如今,随着计算机视觉、多模态交互等技术的突破性进展,具身智能正从实验室的理论构想逐步走向现实应用,在工业制造、社会服务等广泛领域展现出革命性的应用前景。这不仅是一场技术创新的浪潮,更预示着人机协作范式的根本性转变,开辟了通向通用人工智能的关键路径。
在南京清湛人工智能研究院执行院长、清湛智造总经理杨磊的主持下,本届岳麓对话汇聚了计算机视觉与机器人领域的顶尖专家,以《十问具身智能和机器人》为题,围绕具身智能的本质定义、人形机器人发展路径、多模态感知机制、数据采集与仿真、长期任务规划,以及人机协作的伦理边界展开深度探讨。
作为 2024 年人工智能领域的焦点概念,具身智能的定义在对话开始便引发了与会专家的思想交锋。与过去的机器人进行对比,工信部人形机器人专家组组长、国地共建人形机器人创新中心首席科学家江磊认为具身智能最明显的三个作用是感知、思考与进化:“过去的机器人主要依赖控制理论,通过代码执行固定任务,局限性明显。具身智能则很有想象空间,具备感知、思考和进化的能力,通过学习才实现对这个世界的探索,这正是具身智能带给我们最大的解决方案,也给未来带来了广阔的应用前景和展现空间。”
中科慧灵 CTO 马世奎对具身智能进行了本质的系统性思考:“具身智能重点在于'具身',强调智能行为和物理实体间的紧密关系。在完成任务目标的导向下,要将感知、理解、记忆、决策、行动形成闭环。机器人应该成为人类的伙伴和助手,能适应复杂环境变化,理解人类意图并实现默契协作,但也要保持在特定领域、可控范围内发展,而不是追求在各方面超越人类。”
Roboraction.AI CEO 黄浴指出了具身智能和 ChatGPT 等大语言模型的核心差别:“具身智能的核心在于环境交互能力,它能主动影响环境并从环境获取反馈,通过这种双向互动来理解动态环境并积累智能。这种方式类似于人类婴儿的成长过程,也可能是通向通用人工智能的必由之路。”
OpenCV 创始人 Gary Bradski 则从概念本源出发,细致区分了空间智能与具身智能的关系:“空间智能关注定位和三维建模,而具身智能的核心是感知。人类即便在睡眠中也保持着身体感知与思考,清醒时能自然连接外部感知与内存信息,通过持续迭代认知模型来构建理解。” 他还引用了柏拉图的名言:「人类内部精神与外部世界的相对隔离,恰使我们建立了独立认知。」由此,Gary 指出具身智能的关键在于实现类人的模型迭代与持续学习,在内外世界间建立起韧性认知桥梁。
随后,专家们就人形机器人发展前景、多模态学习机制、伦理规范等议题展开了深入探讨。马世奎从技术实现角度指出,“在相应场景里,工业机器人机械臂仍是较好的选择,人形机器人是工业机器人的补充而非替代。”
面对具身智能复杂的数据问题,黄浴强调:“具身智能的数据挑战比视觉要难得多,因为其维度、多样性和演化空间都远超图像或语音。”
江磊从进化和认知的角度,提出了关于人形机器人的系统化思考:“具身智能应该分为三层:视觉的具身智能、手的具身智能和脚的具身智能。就像人类一样,双腿直立行走,大脑思考,双手操作,形成一个能交流对话、创造文明的整体。” 他特别强调,这种分层架构源于对人类智能发展的深入观察,“就像人类婴儿预置了基础行为模型,却需要在与环境互动中实现智能进化。”
然而,Gary Bradski 却对人形机器人的必要性提出了深刻思考。他指出:“在进化过程中,复杂形态是为了解决复杂问题,而现实生活中的大多数问题并未复杂到需要人形机器人的程度。” 他建议从更基础的角度理解具身智能和空间智能——首先要明确 WHAT(识别)以及 WHERE(定位)这两个根本问题。Gary 认为,通过设计适应世界的基础模型并进行仿真训练,也许能创造出形态更简单但依然有效的机器人。
最后,每位专家展望了具身智能在未来 5-10 年的发展愿景,纷纷送出寄语:
黄浴:“借助大模型和视觉语言大模型的突破,期待在未来几年看到护士机器人、家务机器人等真正的产品落地,成为人类工作生活的好助手。”
马世奎:“通过解决通用性和适应性这两个关键问题,让具身智能真正走进生活,在特定领域承担基础性工作,实现人机共融的社会。”
Gary Bradski:“人工智能和机器人是应对人口减少、环境恶化、气候变化等全球挑战的必要工具。它既可能帮助创造美好世界,也可能带来破坏,所以关键在于如何在道德伦理框架下发展。”
江磊:“我们即将推出类似无人驾驶L1到L4的分级分类标准,让具有有限自主能力的人形机器人在人类监督下逐步落地。我相信这是一个充满前景的产业,需要更多厂家共同参与标准制定,推动产业快速发展。”
十问 AI 大模型,共话产业新图景
自 ChatGPT 掀起全球 AI 革命浪潮以来,大模型技术持续快速迭代,从降本提效到应用落地,从算力突破到生态建设,一系列关键议题正考验着行业的智慧。在诺贝尔物理学奖、化学奖相继青睐 AI 研究的标志性时刻,探讨大模型的发展方向显得尤为重要。
在本届程序员节,岳麓对话邀请到产学研各界的顶尖大模型专家,在 CSDN 高级副总裁李建忠的主持下,四位嘉宾将从推理模型(OpenAI o1),智能体(Agent)以及多模态模型(Sora)这些 2024 年的新兴热潮技术作为切入点,展开《十问 AI 大模型》深度讨论。
继二月份 OpenAI 推出 Sora 引领浪潮,今年的多模态模型发生井喷,对此,北电数智首席科学家、复旦大学计算机科学技术学院特聘教授、清华大学电子工程系兼职教授窦德景指出:“人工智能向通用人工智能发展是必然趋势,至少要能听得懂、能理解、能说得出来、能画得出来。因此,多模态技术是一个很自然的发展方向。”
回顾移动互联网时代,中国凭借创新应用,在电商、短视频等领域取得全球领先地位,而在大模型市场中,智谱副总裁吴玮杰认为中国同样有机会孕育出新一代领先全球的创新:“大模型时代仍在快速变化。应用场景广泛。例如在医疗、外卖领域,可以通过大模型辅助医疗或者导航让 AI 做一些操作。我相信大模型和 Agent 的能力,会在中国市场上带来很多新应用和新场景。”
大模型时代的到来,使国内 AI 面临着机遇与挑战。华为计算产品线昇腾领域人工智能生态总经理刘伟坦言,国内企业有机会在构建更加开放和更加易用的生态系统上有所突破:“让国内的企业和研究机构一起来构建 AI 所需要的软件栈和生态链,近一步降低AI应用的经济和技术门槛,加速 AI 大模型应用创新。要通过 AI 解决垂域场景细枝末节的数据生成能力的问题,提升数据的质量。只要有足够耐心等待机遇,我相信国内 AI 大模型的超级应用终会出现。”
谈及 AI 对程序员职业的影响,硅基流动联合创始人袁进辉表示 AI 工具的出现,使得更多非程序员也能通过自然语言编写代码:“我非常相信,未来每个人都是一个程序员,AI 可以满足非常个性化的需求。虽然 AI 确实替代了一部分程序员的工作,但我认为顶尖的技术和智慧仍然需要人类才能实现。”
最后,针对“AGI 能力全面超越人类”的可能性和时间节点,四位专家也有着不同的看法。
窦德景表示:“如果用图灵测试来衡量,那么三年之内就可以实现。但是,如何定义超越人类,这个概念还有点模糊。我认为 AGI 最终将在大多数场景中超越人类,这只是时间问题。” 同样,吴玮杰也认为存在这种可能性:“我认为在接近或达到人类智能水平方面,训练模式起关键作用。我预计,大模型在两三年内可接近人类智能,若要显著超越,可能至少还需五年时间。”
另一方面,袁进辉则有着不同观点:“我相信 AGI 能超越大部分人类,不过 AI 最终还是计算问题。即使它能高效搜索所有的可能性,有时人类却能跳过大量可能性,通过灵感找到最简洁的答案。因此我认为,即使性能提升十倍或百倍,AI 可能仍难以复现爱因斯坦或杨振宁那种灵感迸发的成果。”刘伟也指出,AGI 在特定方面很难超越人类:“大语言模型的知识储备量已远超人类。然而,在情感和灵感等方面,AI 仍难以超越人类,AI 在这些方面的突破可能需要比较长时间。”
三日技术盛宴,共筑智能应用新生态
本届程序员节的精彩远不止于此。在接下来的两天,一场场重磅活动将轮番上演:10 月 25 日的 2024 技术英雄会全体大会将汇聚产业精英,更有 GitCode 开源共创大会暨 G-Star 嘉年华,TechoDay AI 原生云开发工具峰会,鸿蒙开发者论坛:共码未来,待到山花烂漫时等精彩活动相伴,并在各大分会场同步举行开源论坛、模型与工具论坛、智能应用论坛、研发效能论坛、算力论坛等主题论坛。
10 月 26 日,《黑神话:悟空》挑战赛、超级码工厂系列大赛、Amazon DeepRacer 自动驾驶赛车挑战赛等趣味赛事将为开发者搭建展示舞台。同期,共码未来 HarmonyOS Workshop、智码启航:亚马逊云科技技术工坊等技术实践活动精彩纷呈。其中,超级码工厂特别带来了 Amazon Q Developer 生成式 AI 助手的实践体验,这位强大的“编程搭子”不仅能提供技术支持、加速编码,还能帮助开发者实现代码现代化改造,让参与者在趣味体验中感受前沿科技的魅力。来超级码工厂——亚马逊云科技会场,连玩带学,开启一场科技之旅!
第五届 1024 程序员节将全方位展示智能技术的蓬勃生机。这不仅是一场技术的盛宴,更是一次面向未来的探索之旅。让我们相约长沙,共同见证智能创新的璀璨未来。