业界首款能“自适应慢思考” 的开源通用思维链大模型震撼发布！性能比肩OpenAI！

科技 2025-01-23 18:05 北京

点击蓝字

关注我们

大模型发展至今，其理解和生成能力显著提升，不仅得益于数据量和模型参数的增长，也离不开思维链技术的应用。该技术通过模拟人类解决问题的思考过程，引导模型在输出答案前进行深入思考，提供更具解释性的推理步骤，从而提高答案的准确性。但同时，这一技术也带来了答案长度增加和推理计算资源消耗过大等问题。

联通数据智能有限公司于1月18日发布了元景思维链大模型。作为央企首个开源的通用思维链大模型，元景思维链大模型既拥有强大的慢思考能力，又具备不限于数学的多学科、多场景通用推理能力，且能做到针对不同任务和难度的自适应慢思考，大幅降低了资源消耗，实现了大模型“慢思考”能力高性价比落地应用。

推理能力业界领先，超过通义千问QwQ，比肩OpenAI o1

元景思维链大模型基于合成数据进行分步采样构造长思维链形式的答案，经过质量评估后得到长思维链训练集，在此基础上对基座模型进行监督微调，使基座模型具备了“慢思考”能力，后续通过对模型采样构造答案偏序对，经过强化学习后得到最终的元景思维链大模型。

主流榜单的测评结果显示：元景思维链大模型的表现超过了目前最好的通用语言模型（GPT-4o和Deepseek V3）以及业界顶尖开源思维链模型通义千问QwQ。

思维链大模型整体实现方案

“自适应慢思考”显著优化推理性能

元景思维链大模型通过任务自适应和难度自适应两种策略来实现模型的“自适应慢思考”。

主流思维链大模型在知识问答、信息提取等非推理任务中常因过度思考生成冗余信息。元景思维链大模型通过将通用领域指令数据与推理任务的长思维链数据合理配比后以混合微调方式赋予模型一定的任务自适应能力。该模型在推理任务中使用慢思考长思维链模式，在常规任务中输出简洁回答，显著优化了推理性能并缓解了信息过载问题。

在非推理任务测评集上对比，元景思维链模型在保证正确率的情况下明显倾向于生成更短的答案（长度小于100和200个token的数量明显多于通义千问QwQ）：

非推理任务长度对比：元景思维链大模型vs通义千问QwQ

元景思维链大模型在评估模型生成的长思维链数据时，除了考虑生成的答案正确与否，还综合考虑了问题的难度以及生成答案的长度，通过强化学习让模型将答案长度与当前问题的难度相匹配。

在推理任务测评集（MATH）上对比，元景思维链模型在不同难度等级的问题上生成的回答长度较通义千问QWQ均明显下降，并且对于最高难度（Level 5）输出的回答长度减少幅度最低，体现了模型对不同难度等级问题具有一定的自适应能力。

推理任务长度对比:元景思维链大模型vs通义千问 QwQ模型

思维链大模型自适应慢思考对比实例展示：元景vs其他

某主流思维链大模型A的“过度思考”现象示例

某主流思维链大模型B的“过度思考”现象示例

元景思维链大模型自适应慢思考示例

测试效果一览

面对经典的通用语言模型易错题，元景思维链模型可以按照“慢思考”的方式自动避坑一步步生成正确答案：

面对数学领域常见的考察是否会遗漏负数的“陷阱题”，元景思维链模型可以在思考过程中通过反思检查，成功发现需要考虑负整数的情况，最终得到了正确答案：

对于经典的24点游戏，元景思维链大模型在不断尝试后正确给出了答案：

在逻辑推理问题题上，元景思维链模型经过思考后顺利找到了解决方案：

元景思维链模型顺利解答出了物理和化学高考真题：

联通元景思维链大模型不仅能够完成复杂的推理任务，而且通过“自适应慢思考”有效提升了思维链模型应用的性价比，具备赋能医疗诊断、工业设备故障检测等应用场景落地的能力。

面向未来，中国联通将持续升级基础模型能力，不断量化和扩展模型能力边界，深化与国产算力的合作，为千行百业提供更懂行业，更加安全普惠的数智服务。

目前，元景思维链模型已在GitHub、魔搭、始智等社区全面开源，网页地址可后台回复“元景思维链大模型”获取。

-END-

科协官网｜https://kx.10010.com/

投稿邮箱｜hqs-kx10010@chinaunicom.cn

来源 | 联通数智有限公司

编辑 | 潘贝贝

校审 | 赵鑫、吕新

最新文章

“哪吒闹海”，算力升级！DeepSeek-R1系列模型上架！

两大创新工程启动！

今日立春 | 冬去春来万物生长

蛇舞新春！联通科协给您拜年啦！（文中有福利）

除夕好运到！抽奖活动火热进行中，速来围观！

陈忠岳董事长新春致辞：坚持融合创新为建设网络强国、数字中国作出新的贡献

新春献礼🥳粉丝专享福利大礼包，限时领取！

【有奖互动】联通科协2024年度十大事件&科技新闻

联通数智公司获评AIIA模型服务工作组优秀单位

AI拜年！红包封面🧧大放送，先到先得！

《乡脉·AI村晚》来了，AI助力乡村振兴！

中国联通完成业界首个5G-A通感铁路应用试点验证

联通科协思享汇，共赴科技新春！

科创有成效，两项首台套！

业界首款能“自适应慢思考” 的开源通用思维链大模型震撼发布！性能比肩OpenAI！

最新消息！又一新成果获两项“三首”认定

联通元景港口大模型再获认可！

速来报名！诺奖得主与院士“思维大碰撞” 最强大脑”智慧交锋

联通研究院获奖！

@所有人，投票啦！快来pick你心中的年度科技新闻吧~（上）

@所有人，投票啦！快来pick你心中的十大科技新闻吧！（下）

人民日报头版报道！

今日大寒 | 岁末大寒至静候春归来

中国联通-国自然企业联合基金发布诚邀合作！

上海联通5G-A温情守“沪”，点亮春运回家路

特别关注！北京市科委领导赴中国联通集团调研

马路上的摄像头，到底在拍啥？

全国首个！省级教育联防联控平台

关注！这一地开展青托人才遴选辅导

中国联通元景大模型RAG技术获最高评级

省内唯一！获批设立省级博士后创新实践基地

强强联合！开启智算领域新篇章

斩获佳绩！让数字技术赋能中医药传承创新

脱颖而出！3个项目入选

精彩回顾：7场科创大讲堂，点亮科技火花

上海市仅三家！国家级课题成功揭榜立项！

共建共享新模式！当好“社区合伙人”

中国联通与7大数据标注基地联合发起共建倡议

中国联通APP 12.0等你来体验！

落实“百大工程”，中国联通推进重大专项！

手机直连卫星技术，中国联通首发后国际又完成一例！

开源下载！业界首款

首批入驻！新获授牌

浙江联通科创大会启幕，科协成立开启科创新征程

学习强国、新华日报力荐！廉士国博士这堂课燃爆全网！

一等奖！脱颖而出

多项入选！“星芒”

“千人进千企”年度总结会

小寒 | 心中有暖岁月不寒

【今日大事件】拥抱2025，这场大会看点爆棚！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉