逆袭传奇！国产大模型黑马杀出重围，直逼腾讯宝座，73.56高分不得不服！

科技 2024-10-18 15:03 江苏

在这个金秋，“日日新·商量”又拿了金牌！

今日，中文多模态大模型测评基准SuperCLUE-V发布10月榜单：

商汤日日新·商量多模态大模型（SenseChat-Vision5.5）凭借多个任务上的出色表现，总得分位列国内大模型第一梯队，智夺金牌。

凭借卓越的多模态基础能力和出色的应用能力，商汤SenseChat-Vision 5.5荣获了总分73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。（商量多模态大模型API入口<限时免费!>：https://platform.sensenova.cn/doc?path=/model/mllm.md；商量注册体验链接：https://chat.sensetime.com/）

SenseChat-Vision5.5基础能力突出，

数理逻辑维度超越GPT-4o

本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基础能力和应用能力两个大方向，以开放式问题形式对多模态大模型进行评估，涵盖了8个一级维度30个二级维度。

报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示，在数理逻辑分析能力中，SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本，位列第一。

SuperCLUE-V采用细粒度评估方式，构建专用测评集，每个维度进行细粒度的评估并可以提供详细的反馈信息，以下为SenseChat-Vision 5.5测试案例部分呈现：

目前，多模态大模型能力显著提升，可提供纯语言、多图理解、语音、文生图、拟人、端侧模拟、行业模型等多模态、多版本、强场景Agent形态。

前瞻构造高阶思维逻辑数据，

用推理能力增强AI大模型智能

如今，复杂推理成为各模型之间的重要能力壁垒。对于大模型能力的分层，商汤科技董事长兼CEO徐立此前就提出三层架构(KRE)理论，即:

第一层知识(Knowledge)，世界知识的全面灌注；

第二层推理(Reasoning)，理性思维的质变提升；

第三层执行(Execution)，世界内容的互动变革。

这三层可以组成一个对于世界提供生产力工具模型的完备能力，其中提升基础模型的推理能力是目前人工智能发展的大方向。徐立还提出在垂直行业里如何构造高阶思维逻辑的合成数据，也是制胜关键。

今年7月发布的“日日新5.5”大模型体系就创新使用大量使用合成高阶思维链数据，提升推理思维能力，在数理逻辑、英文、指令跟随等方面能力增强明显，2个多月的时间把基模型的能力提升了30%。

未来，商汤科技将继续坚持基础大模型的持续研发与投入，前瞻探索最先进的大模型技术，突破数据与算力的限制，引领大模型的创新与落地。

目前，SenseChat5.5已经应用在商量网页版（WEB）——一款擅长高效搜索、整理、输出信息的智能应用，工作、学习、生活中的任何问题，问问商量，都能解决。

http://mp.weixin.qq.com/s?__biz=Mzk0MzYxMjgwNw==&mid=2247487870&idx=1&sn=871c6607f1821a33bb12e2dd8f682eb8

AI科技之窗

全网最懂AI的科技博主！200万科技爱好者都关注的公众号。全面解读全球AI新闻。未来是人工智能提升生产效率的时代，2024年AIGC，智能驾驶，量子计算机，万物互联，虚拟现实等等应用爆发的一年，当下正在经历第四次科技革命。

最新文章

寒武纪！为所欲为？快哉！

蓝色光标：什么是真正的All in AI？

港大孵化“独角兽”，赴港上市遭疯抢！公开认购超5000倍。

什么原因？OpenAI o1准确率竟下降36.3%！

【重要通知】智算技术与算力规划设计及部署方案与实践在南京开班了！！！

国产GPU龙头千卡集群大突破，性能提升近一倍！

真恶心！寒武纪又爆雷亏7个亿。（文中有惊喜）

老美远远落后！国产的AI 的「Phone Use」时刻也来了！自动帮忙开房叫外卖。

OpenAI新技术提效50倍

GLM-4-Voice：智谱新一代端到端语音大模型，同步开源。

大超越GPT-4,讯飞星火4.0 Turbo发布，首发11项技术及应用

4年亏损100亿，估值1000亿！特朗普垂涎三尺的独角兽即将香港上市。

拜登寐以求封杀的“中国独角兽”，寒武纪遭骂，谁之过？

9月全球代表作学术排名——量子物理与医学研究新突破，材料科学与跨学科创新成就

逆袭传奇！国产大模型黑马杀出重围，直逼腾讯宝座，73.56高分不得不服！

奥迪“臣服”国产智驾？特斯拉坐不住了，商汤解密背后真相！

“寒王”把黄阿姨推倒：“服不服？”

AI双杀诺贝尔奖！难道霍金预言成真了？

太硬了！忍了44年，那个男人终于憋不住了！发射！

焦虑了！大厂连夜紧急开会！GPT-5高达5万亿参数。比GPT-4强大100倍。GPT Next？

不可思议！龙芯GPU逆袭！英伟达黄急跳墙，算力提高10倍。

开创“寒武纪” 陈天石：“未来无处不在的AI应用的垫脚石”。

从“冷门”中诞生，“寒武纪”是怎样炼成的？ | 科技自立自强之路

谷歌T G6芯片曝光：台积电2nm，三星良率不足10%。TPU能否撼动苹果的地位？

英特尔斩获再获35亿美元补贴，美军国防芯片生产成关键转折点。

历史记录！甲骨文豪掷13万块Blackwell GPU，打造全球最大的算力集群。总投资200亿美元。

不为人知的秘密！OpenAI 草莓o1大模型，急需10万颗B200集群算力。

眼前一黑！国产GPU大地震！“华夏芯”白菜价破产，起拍价不到30000元！

麻雀变凤凰！联想美国市场份额达到14%，联想到底做对了什么？

《冰封王座》——中科寒武纪屁股做空。

离了大谱！国产GPU龙头轰然倒下，哭着：“我们到底做错了什么？”

扬眉吐气！国产高铁“芯片”打破50年垄断，西方慌了：立马降价

菲律宾飘了？前脚挑衅我国，后脚又想强卖5.4万吨榴莲，中方：白日做梦！

向全世界宣布！我国科学家新突破：打破欧美垄断，万元洋货大跌85%

3000万钻石豪车出圈，河南5位数高定钻排单紧俏，富豪：想要得靠抢

为什么说海光才是国产AI PC黑马？

坚决“去中国”到底！反华弹丸小邦外债470亿将破产，我方：再拆200条铁轨

宁愿报废也不卖给中国！俄方撕毁4.6万吨级核潜艇订单，背后留有一手？

正面硬刚！国产时间科技打破美日20年垄断，美媒崩溃：能不能别卷了

AI算力全场景应用，国产DCU加速卡卖疯了！

谷歌前CEO警告：AI控制权=世界霸权？中国想做老大！——失控的AI竞赛

又一个美国科技巨头趴窝，1000名精英被裁，想不到的竟然是。。。

"科技战升级！美国重拳出击：42家中企入'黑名单'总数量已超1300家。全球科技版图震动！

狂跌97%，中国造出首台1.9ATA“时光舱”，欧美哀叹：往后高价卖给谁？

两个宇航员都没回来，美国还想定月球时间？结局大快人心

靠一辆自行车,征服任正非的天才少年稚晖君！发布了0元模块化机器人。碾压特斯拉！

拦不住了？ 4款战机齐上舰，福建号“四试”蓄势待发，直捣美国家门

惹不起俄方，转身挑衅中国？弹丸小国千里来犯，6000吨战舰直逼东海

美国防部认怂！中国雷达巨头被移出黑名单，获胜手段很少人看懂

挑衅不成反自损？菲律宾又来碰瓷，被撞出1米大洞，中方发出最后通牒

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉