AI大模型｜上海人工智能实验室强推理模型书InternThinker开放体验：自主生成高智力密度数据、具备元动作思考能力

政务 2024-11-26 11:49 上海

上海人工智能实验室（上海AI实验室）致力于通过“通专融合”路径探索开放、可控、可信的通用人工智能（AGI），其关键技术之一在于同步提升深度推理与专业泛化能力。

2024年11月25日，上海AI实验室展示了自主生成高智力密度数据、具备元动作思考能力的“模型”等一系列创新进展，并开放强推理模型书生InternThinker试用体验。该模型具备长思维能力，并能在推理过程中进行自我反思和纠正，从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。

试用链接：https://internlm-chat.intern-ai.org.cn（点击文末“阅读原文”直达，登录后点击左侧InternThinker即可体验）。

在OpenAI o1模型发布之前，上海AI实验室就已开展了相关技术的独创性探索与实践：在训练数据侧，在国内率先开发出大规模合成数据技术；在任务场景侧，新模型在数学、代码、推理谜题等多种场景都能体现出较强的推理能力，并具备一定的任务泛化性。

上海AI实验室的研究团队创新性地设计了元动作思考范式来引导模型的搜索空间，使模型更高效地习得和产生多样化的推理策略组合；基于通专融合的方式进行数据合成，并通过构建大规模沙盒环境获取反馈，在不依赖o1这类已有强推理模型的情况下，实现高质量思维链的独立构建，并大幅提升模型的复杂任务处理性能。

强大的推理能力是迈向通用人工智能的重要基础，今年7月发布的书生·浦语2.5实现了开源模型中领先的推理能力，InternThinker则使大模型的推理能力再上新台阶。下一步，上海AI实验室将把相关技术融入下一代书生大模型，并继续沿着通专融合发展路径，通过开源与产学研各界共同推动技术进步。

“元动作”思考：提升推理策略习得效率

为高效提升模型的推理能力，InternThinker采用了更接近人类学习方式的路径。

人在学习解决复杂推理任务时，并非从海量的样本中进行单点知识的学习，而是思维模式的学习——在解决问题的过程中，通过回忆相关知识点，对正确的解题过程进行理解、记忆，对错误解题等过程进行反思和修正，即对自我的认知过程进行觉察和调节——该能力也被称作元认知能力。元认知理论的相关研究发现，通过显式地引导和感知人在解决问题过程中的思想模式，可提升复杂任务的学习和解决效果。

受元认知理论的启发，研究团队设计了一系列元动作来引导模型解决问题的过程，如对问题的理解、知识回忆、规划、执行、反思、总结等。模型在面对复杂任务时，会显式且动态地选择元动作，再进一步展开相关动作的具体思维过程。通过这种设计，利用部分训练任务，可强化模型对关键元动作组合的使用，显著提升模型学习效率。

在未经元动作引导和学习的情况下，模型在解决问题时多采用链式推理策略（如下图左侧所示），难以解决更加复杂的任务并进行自我纠错。而经过元动作的引导和学习后，模型能够在解决复杂任务时自发使用“回忆知识-解答”，“执行-反思”等策略组合。

研究团队认为，模型在思考过程中能更灵活、多样、有效地使用元动作，是模型在推理阶段能够利用更多思考时间解决更复杂任务的重要原因。

“通专融合”探索高密度监督数据路径

高密度监督数据路径框架

通、专模型协作：合成高密度数据

获取已有强推理模型的思维链数据并进行蒸馏，是提升数学等榜单性能及复现强推理模型的“捷径”。

InternThinker则率先独创性地采用了基于通专融合的技术路线生产所需数据。研发团队设计了多种通用模型和专业模型的协作流程：首先基于专家模型搜索出针对复杂任务的正确解决轨迹（但这种轨迹数据并不直接适用于元动作思维能力的训练）；进而由通用模型对复杂任务解决过程进行觉察、分析、改造和质量完善，基于正确轨迹提升思维链的格式规范性和可学习性，最终产出用于模型训练的数据。在此过程中，模型和数据会交替迭代，达到协同增强的效果。

构建大规模沙盒环境：交互中获得反馈信号

面对丰富多样的推理任务，如何准确地获得过程和结果反馈尤为关键。为此，研究人员针对专业任务构建了大规模的沙盒环境，为可形式化验证的推理任务提供反馈信号，包括数十种编程语言的高效率代码执行编译环境，以及代码领域之外的通用推理任务沙盒。

通过自动化专家模型、人机协同策略生成等方法，构建了超过50种不同逻辑思维方式的推理任务思考过程，通过沙盒环境提供思考过程的反馈，形成自下而上对模型思维能力的构建，为模型的自主演进提供精准的反馈信号，从而高效地将专业任务的能力融合到InternThinker中。

体验案例

下面是一道2024年9月全国高中生数学竞赛联赛的题目。模型会先回忆相关的知识点，然后逐步进行推理和计算，最终形成解答。

接下来是挑战类似“24点”但难度更高的问题。可以看到模型会先进行尝试，发现“此路不通”后当即会换一条路径，展现出了InternThinker的反思和修正能力。

在Leetcode（面向全球 IT 人才的技能成长平台）本月新近的赛题中，InternThinker不仅很好地回答了问题，而且在编写完代码之后还进行了仔细的检查。

最后，给InternThinker提一个抽象的推理问题，让模型找到矩阵变换的规律（这里将矩阵渲染成方块便于可视化，不同数字用不同颜色表示，其中白色表示0）。

InternThinker同时也可以执行填字游戏任务。

InternThinker模型仍在持续迭代中，欢迎广大用户及开发者试用及反馈。试用链接：https://internlm-chat.intern-ai.org.cn（登录后点击左侧“InternThinker”即可体验）。

来源：上海人工智能实验室

编辑：zy

↓分享

↓点赞

↓在看

http://mp.weixin.qq.com/s?__biz=MzA3Mzg1NzkxMQ==&mid=2650154441&idx=1&sn=df6b9554769ecf1d4e693ab89728cf9e

上海科技

一起来看“所有人关注的科技事”和“科技人关注的所有事”

最新文章

创新启航，共绘新篇——2024上海-六安科技成果对接交流活动在六安举办

【通知】关于上海市2024年度“科技创新行动计划”空天海洋科技领域（第一批）项目立项的通知

高端硅基材料研发全面突破300mm关键技术瓶颈｜上海市重点实验室

【公示】关于2024年第四批上海市科技创新券（仪器类）的公示

【直播间】“中国上海”门户网站在线访谈即将开讲！市科委介绍如何全力推动上海国际科技创新中心建设

低延迟多源超眼计算成像技术及应用｜上海市科学技术奖

【通知】关于上海市2024年度“科技创新行动计划”超导领域技术攻关项目立项的通知

上海科技青年35人引领计划100名候选名单公布！有你熟悉的吗@科技青年

【公告】关于2024年第5批上海市高新技术成果转化项目认定的公告

【公告】关于《上海市促进医疗卫生机构科技成果转化操作细则（修订草案征求意见稿）》公开征求意见的公告

【通知】关于上海市2024年度“科技创新行动计划”细胞与基因治疗专项项目立项的通知

【通知】关于上海市2024年度“科技创新行动计划”合成生物学领域项目立项的通知

【通知】关于上海市2024年度“科技创新行动计划”农业科技领域项目立项的通知

【公示】关于上海市2024年度“科技创新行动计划”科技成果转化服务体系建设、科学仪器和化学试剂拟立项项目的公示

AI大模型｜上海人工智能实验室强推理模型书InternThinker开放体验：自主生成高智力密度数据、具备元动作思考能力

移动端轻量化智能计算关键技术与平台应用｜上海市科学技术奖

【公示】关于2024年度上海市科技创新创业载体绩效评价结果的公示

【通知】关于上海市2024年度“科技创新行动计划”启明星项目立项的通知

【公示】关于上海市2024年度“科技创新行动计划”技术标准、脑机接口拟立项项目的公示

首批尚思探索学者名单公布，这20位科学家入选→

复宏汉霖：聚焦小细胞肺癌“荒漠”，差异化策略开拓新版图 | 2024高转项目自主创新十强

深化沪台科技交流合作，助力在沪台企创新发展

Cell | 破解蛋白质未解之谜，复旦大学研究团队绘制人类健康与疾病蛋白质组图谱

【公示】关于上海市2024年度“科技创新行动计划”生物医药创新发展等拟立项项目的公示

【通知】关于上海市2024年度“探索者计划”（第一批）项目立项的通知

2024中国医药工业发展大会和上海国际生物医药产业周开幕，实验动物研究领域项目启动立项…|魔都壹周科技（11.16-11.22）

创新文化｜米磊：创新就得大胆承担风险和损失，甚至是“浪费”①

张江高新区｜新华社：从咸菜小镇到“科学之城”，硬核张江这样炼成

数据驱动超大城市绿色公共建筑节能增效｜上海市科学技术奖

Nature | 时隔9个月再登《自然》！同济大学王平团队揭示缬氨酸感应新机制及其在肿瘤治疗中的应用

从参与者到推动者中国创新药厚积薄发闯四方

遗传性骨病精准诊治破解之路：从基础研究到临床应用｜上海市科学技术奖

【通知】关于上海市2024年度“科技创新行动计划”实验动物研究领域项目立项的通知

低空经济的风吹到了上海双创赛场，“赛投融合”引导社会资本投早投小投硬

【Bio-talk】肝脏再生的“星火燎原”，这家创新药公司如何与肝病作战

预防中风：国际首款具有适宜细胞响应的左心耳封堵器｜上海市科学技术奖

融合创新驱动发展，医药工业产业开放迎未来，2024中国医药工业发展大会与上海国际生物医药产业周16场系列活动成功举办

创新持续升级，链接全球生态，生物医药产业投融资论坛举办｜上海国际生物医药产业周

全力打造全球生物医药创新高地和世界级产业集群，张江协同聚力新质发展论坛举行｜上海国际生物医药产业周

NewCo不NewCo？和黄医药崔昳昤：用长板对接长板，找到最适合的模式｜上海国际生物医药产业周

一颗芯片改变了一整类高端科学仪器的命运｜上海市科学技术奖

中国工程院院士夏宁邵：拒绝“内卷”，用创新让中国疫苗驶向全球健康快车道｜上海国际生物医药产业周

复星国际陈启宇：生物医药行业进入创新快车道，全球产业链期待更多中国“链主”｜上海国际生物医药产业周

获批创新药械数量全国领先！全链条赋能，上海打造世界级生物医药产业集群

金句来了！

医药工业全球合作典型案例｜分享创新突破助力合作共赢

从5G树干到“未来”新枝，6G如何在技术“大树”上蓬勃生长@高通柯诗亚

满满干货！2024中国医药工业发展大会与上海国际生物医药产业周主论坛邀请哪些大咖，有哪些亮点，一起来看→

2024中国医药工业发展大会和上海国际生物医药产业周在沪开幕！陈吉宁金壮龙曾益新致辞，龚正主持

陈凯先院士谈生物医药行业同质化：原始创新是突破“内卷”的根本｜上海国际生物医药产业周

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉