SuperCLUE榜单最新发布，中国电信星辰语义大模型综合能力位列第一梯队！

科技 2024-11-28 19:11 北京

近日，SuperCLUE作为国内权威通用大模型综合性测评基准机构，发布了最新《中文大模型基准测评2024年10月报告》（简称：《报告》）。《报告》显示，由中国电信打造的星辰语义大模型TeleChat2，凭借出色表现，综合能力位列大模型第一梯队。在理科工具调用维度上，TeleChat2排名前二；在Agent智能体总榜上，排名并列第二。这充分展现TeleChat2在技术上的领先优势，也彰显了中国电信在大模型研发领域的深厚实力。

数据来源：SuperCLUE

TeleChat2-35B以更小参数量和更佳效果获得开源模型排行榜铜牌，综合效果超过Llama-3.1-70B-Instruc和Llama-3.2-90B-Instruct等较大参数模型。

数据来源：SuperCLUE

星辰语义大模型由中国电信创新研发并不断迭代突破，TeleChat2系列是依托星辰语义大模型TeleChat推出的第二代版本。今年9月，中国电信人工智能研究院（TeleAI）正式发布并开源了首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——TeleChat2-115B。近日，TeleAI团队进一步开源了TeleChat2-3B、7B和35B，以适配不同场景的应用需求，构建了全尺寸大模型的开源布局。

超强工具使用

《报告》涵盖43个国内外具有代表性的大模型，采用多维度、多层次的综合性测评方案，由理科、文科和Hard任务三大维度构成，测评题目超2900道。在理科任务方面，TeleChat2展现了极强的函数调用能力，在工具调用维度排名前二；在文科任务方面，TeleChat2在语言理解、长文本等维度表现突出；在Hard任务方面，TeleChat2在指令遵循维度表现优异，展现出优秀的复杂推理能力。

为提高大模型性能，TeleAI团队在数据维度和后训练阶段进行优化。在数学能力方面，通过抽取知识点合成问答数据，并结合训练奖励模型（Reward Model）筛选出高质量数据；在代码能力方面，抽取高质量代码函数合成功能实现代码，并通过单元测试确保代码质量；在指令遵循能力方面，利用指令进化构建大量数据并进行脚本校验，从而大幅提升模型效果。在后训练阶段，TeleAI团队通过模型微调、权重融合和直接偏好优化等手段进一步优化效果；在微调阶段，使用指令跟随难度和拒绝采样微调等技术筛选数据，并迭代更新模型；在权重融合阶段，结合多个模型的优势获得新权重；在直接偏好优化阶段，专注于中等难度问题，迭代补齐模型能力。

此外，TeleChat2系列模型还完成了Agent能力建设，重点加强了模型在指令跟随、任务拆解、工具调用等方面的能力和表现。在SuperCLUE Agent总榜中，TeleChat2排名并列第二。

undefined

数据来源：SuperCLUE

TeleAI团队构建了基于图结构和多智能体（Mutlti Agent）的框架，通过细分工具场景，创建详细的依赖关系图，从而提升训练数据的真实性和复杂度。此外，团队还将工具调用能力分为多个阶段，为每个阶段设计多样化的训练数据，使模型效果提升约15%。

全尺寸开源布局

TeleAI团队通过开源促进大模型技术创新和国产化进程，并为产业持续输送领先的技术能力，加速应用落地。上半年，TeleAI团队已陆续开源了1B、7B、12B和52B参数的第一代TeleChat系列模型。最近，TeleChat2系列也已完成3B、7B、35B和115B模型的开源，逐步构建全尺寸开源布局，吸引了国内外广大开发者的讨论和使用。

undefined

荣誉证书

凭借卓越的性能和对开源生态的贡献，星辰语义大模型在Gitee开源社区获得了“GVP-Gitee最有价值开源项目”的称号。此前，星辰大模型还被中国信息通信研究院授予“可信开源大模型成熟度能力”认证和“2024年度央国企开源项目典型案例”称号。不仅展现了对星辰大模型技术的认可，也体现了在推动国内开源生态建设方面的重要作用。

TeleChat2系列模型凭借不同的参数配置和弹性的架构设计，可灵活适配于不同应用场景、资源配置、延时条件及响应速度的多样化需求。目前，星辰语义大模型系列已在政务服务、智慧教育、经营分析、公文写作等领域实现广泛的应用落地。

在政务场景，星辰语义大模型应用于智能知识库、受理助手、分类助手、客服机器人、语音坐席助手等方面，有效提升政务工作效率；在教育领域，星辰语义大模型成功应用于教育听力机，辅助学生进行英语口语对话练习、中英文写作、中文诗歌创作等方面，提升学生的学习兴趣、增强个性化体验；在智慧办公场景，基于星辰语义大模型的超强语义理解和总结能力，“星辰慧记一站式会议助手”能够一键提炼会议纪要，实现会后总结立即生成，推动企业高效、智能发展。

在本次参选的43家大模型企业中，TeleAI是唯一的央企大模型机构，彰显了其在技术创新与自主可控方面的领先地位。未来，TeleAl将继续深耕前沿技术探索，坚持基础大模型的持续研发与投入，打造全球领先的大模型底座和基础能力。

编辑 | 黄亚洁

审核 | 中国电信集团科协运营团队

来源 | 中国电信今日头条号

科创电信

“科创电信”是中国电信科技创新门户，致力于弘扬科学家精神，推动科技创新，普及前沿技术，服务科技人才，促进科技成果推广，开展对外技术交流协作。欢迎商务合作。

最新文章

中国电信成果参选2024年度央企十大国之重器，等你投票！

中国电信成果参选2024年度央企央企十大超级工程，邀你投票！

每周电信 | 中国电信召开科技创新大会，发布未来三年行动计划；工信部优化车联网直连通信信道配置……

首批！入选中央企业科技成果应用拓展工程项目清单

天翼视联获第三届“光华杯”千兆光网应用创新大赛智慧能源专题赛决赛一等奖

电信科技节 | 中国电信第四届科技节·山东站暨2024山东电信科技节成功举办

中电信数城科技协同石家庄电信签约千万级智慧园区项目

上海电信成功举办基于CodeFree的研发大模型提示词决赛

启航新纪元，2024新疆电信AI大模型应用培训班圆满收官

中国电信召开科技创新大会，发布未来三年行动计划

祝贺！上海电信“绽放杯”斩获佳绩

每周电信 | 第一届京津冀大模型应用创新大赛圆满收官；2024年中国5G发展大会在上海举行……

GSMA发布《运营商实践：AI大模型赋能垂直行业标杆案例集》

AI赋能无限未来，第一届京津冀大模型应用创新大赛圆满收官

智能网络公司5G云网融合助力智能网联汽车高质量发展

湖南电信助力超卡工厂入选“5G+工业互联网”示范工厂

2024广东省信息通信信息化系统管理员职业技能竞赛暨研发云开发者大会圆满举行

“雄安新区容东片区智能化数字道路光网建设应用与实践”项目荣获“光华杯”一等奖

祝贺！浙江电信荣获第三届“光华杯”数字生活专题赛全国一等奖

智库洞见 | 全球主要国家手机直连卫星发展现状及对我国启示

上海公共服务MaaS及成果转化联盟成立，上海电信加速AI医疗应用落地

基于中国电信云网融合大科创装置完成行业短信网关分钟级自动容灾切换技术验证

每周电信 | 中国电信2024数字科技生态大会圆满举办；2024中国无线电大会在四川省资阳市开幕……

2024数字科技生态大会 | 中国电信2024数字科技生态大会圆满举办

2024数字科技生态大会 | 中国电信天翼视联十大科技成果及十大创新应用发布

“发展新质生产力，信息网络演进技术”专题论坛在成都成功举办

2024数字科技生态大会 | 中国电信举办数字生活创新应用合作论坛，正式发布美好家品牌及创新成果

2024数字科技生态大会丨中国电信携手合作伙伴共启中小企业数字化转型“加速键”

2024数字科技生态大会 | 天翼物联以AI+万物智联为引领，赋能新质生产力发展

2024数字科技生态大会丨中国电信发布多项联合科技创新前沿成果

2024数字科技生态大会 | 2024移动支付现代产业链共链大会正式召开，中国电信领航央企支付新生态

2024数字科技生态大会 | 中国电信举办数据要素合作论坛，发布“星海”大数据品牌体系

2024数字科技生态大会 | 资本聚力，开放合作赢未来，资本生态合作论坛在广州举办

2024数字科技生态大会 | 中国电信发布全自研视频生成大模型，完成全模态体系构建，首届TeleAI开发者大会在穗举办

2024数字科技生态大会 | 中国电信发布2025终端技术发展策略

2024数字科技生态大会 | 中国电信数智渠道终端生态合作暨中国电信终端产业联盟第十五次会员大会在穗举办

2024数字科技生态大会 | 中国电信AI+云网生态合作专题论坛在广州举办

2024数字科技生态大会丨中国电信柯瑞文：AI赋能共筑数字新生态

2024数字科技生态大会 | 中国电信唐珂：智启新程领航低空，中国电信全面开放低空信息基础设施能力体系的生态合作

2024数字科技生态大会 | 北斗相伴安全随行，中国电信启动北斗短报文终端伙伴合作计划

中国电信柯瑞文：勇当量子产业国家队

中国电信梁宝俊：建设好运营好昆明国际通信业务出入口局，助力云南面向南亚东南亚辐射中心建设

每周电信 | 中国电信获两项中国通信学会科学技术奖一等奖；工信部等十二部门联合印发《5G规模化应用“扬帆”行动升级方案》……

中国电信获两项中国通信学会科学技术奖一等奖

即将启幕！AI赋能，共筑数字新生态，2024数字科技生态大会

天翼物联获2024物博会“三新”金奖与创新奖

广西电信开展举办2024年“扬帆启航”首期二开三阶培训班，赋能产数发展

重磅！中国电信沙特公司正式成立

SuperCLUE榜单最新发布，中国电信星辰语义大模型综合能力位列第一梯队！

甘肃电信举办“金种子”AI能力提升培训班

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉