拿下国内第一！这家初创大模型公司终于不再低调

情感 2024-11-23 10:01 重庆

在国内AI领域，虽然不断有新的大模型涌现，真正获得国际认可的却寥寥无几。但近期一款名为Step-2-16k-202411（以下简称Step-2）的国产大模型却在国际上引起了广泛关注。

近日，国际权威榜单LiveBench发布了最新一期排名，来自阶跃星辰的Step-2脱颖而出，位列第五，紧随OpenAI的o1-mini和Gemini 1.5 Pro 002等国际主流模型。值得一提的是，Step-2是唯一一款进入前十的国产模型，而阿里开源的qwen2.5-72b-instruct则排在了第十三位。

LiveBench作为由图灵奖得主、Meta首席AI科学家杨立昆（Yann LeCun）联合Abacus.AI、纽约大学（NYU）、英伟达等多家机构共同推出的大型语言模型（LLM）评测基准，被行业广泛认可，更被誉为“全球首个无法作弊的LLM基准测试”。该榜单专为大模型设计，从包括数学、推理、编程、语言理解、指令遵循和数据分析在内的多个复杂维度对模型进行评估，包含6个类别的17个不同任务，每月更新新问题。

据榜单显示，Step-2在IF Average（Instruction Following 指令跟随）这一项上表现突出，超越了包括o1-preview-2024-09-12在内的所有测试语言大模型，获得了最高分86.85分。

在IF Average这一项进行测试中，测评团队为模型提供了一篇来自《卫报》的文章，要求模型遵循多个随机抽取的指令，并完成与文章相关的四个任务之一：释义、简化、故事生成和总结。评测结果显示，Step-2在这一测试中获得了86.57的平均分，而gemini-1.5-flash-002得分84.55，是唯二超过80分的模型。

这表明，Step-2在语言生成上对细节的控制力非常强，尤其是在理解模糊指令、处理特定领域或边缘分布中的复杂问题、根据指令对文本进行精确调整和优化等方面，表现出色。

打造出如此强大的大模型背后的公司——阶跃星辰，究竟是家怎样的公司呢？

信息显示，阶跃星辰成立于2023年4月，至今不过一年多的时间，是一家相对低调的创业公司。不过其创始人姜大昕却是一位行业内重量级人物，曾担任微软全球副总裁，在机器学习、数据挖掘、自然语言处理和生物信息学等方面拥有十多年的研究和工程经验。特别是在数据挖掘和行业自然语言处理方面有深厚的研究，发表过近200篇相关论文。

阶跃星辰可以说是“含着金汤匙”出生的公司，不仅创始团队实力雄厚，还受到资本市场的一路追捧。早在成立初期，阶跃星辰就就获得多家VC的青睐，其中包括启明创投、五源资本等一线风投，均参与该公司早前几轮融资。今年上半年，有消息称阶跃星辰正在进行一轮估值20亿美元的新融资，阿里巴巴也在投资者名单之列。如果此轮融资成功，阶跃星辰将直接晋升为头部AI独角兽企业。

虽然成立时间不长，但阶跃星辰的发展速度却很快。今年3月，阶跃星辰推出了首个版本的千亿参数多模态大模型Step-1V。7月，又在世界人工智能大会（WAIC）期间，一口气发布了三款Step系列通用大模型新品。其中，除Step-2万亿参数语言大模型正式版之外，还包括Step-1V的迭代版本Step-1.5V多模态理解大模型，以及Step-1X图像生成大模型。凭借优秀的研发能力，阶跃星辰也获得了国内“大模型六小虎”之一的赞誉。

在C端，阶跃星辰推出的智能助手“跃问”和AI开放世界平台“冒泡鸭”，也均获得了不俗的市场反响。目前，“跃问”已经接入Step-2万亿参数语言大模型，用户在跃问App和跃问网页端都可以体验到这款大模型的强大功能。

当前，大模型技术的发展正逐渐趋于理性，在技术革新步伐放缓的背景下，越来越多像阶跃星辰，或许能给行业带来新的灵感与创意。

http://mp.weixin.qq.com/s?__biz=MjM5MTg5ODAyMQ==&mid=2652152419&idx=1&sn=a408dbe6cfba23b01386303847086307

商界BIZTECH

打造新科创第一媒体做AI场景应用领航者

最新文章

拿下国内第一！这家初创大模型公司终于不再低调

AI超级应用第二战场：陪伴型产品的潜力与边界

最全！这些国内eVTOL亮相第十五届中国航展

最复杂多智能体发布！百度推出“秒哒”和文心iRAG

资本涌入、基金成立，低空经济成2024年最大黑马

跨界涌入人形机器人？做充电宝的、空调的都来了

具身智能中场思考：人形机器人要多像人？

仅重25KG，国内首台超轻量级人形机器人问世！

AI也能像人一样玩手机？智谱AI推出自主智能体AutoGLM

商业航空风口来临！太空旅行船票首次公开售卖

对话|久尺网络胡建强：长期看算力应与终端分离，未来更宜放云上

强联智创®完成亿元D+轮融资，加速推动医药健康产业高质量发展

对话|帕西尼许晋诚：未来的人形机器人也会疼

百亿基金成立！AI融资热度不减，国内外持续加码

“筷子夹火箭” ，SpaceX星舰首次回收成功

AI再夺诺奖！2024年诺贝尔化学奖也颁给人工智能

2024年诺贝尔物理学奖揭晓！AI教父获奖

填补空白！我国首次成功点亮硅基芯片内部激光光源

对话|星海图高继扬：打造“一脑多形”的具身智能机器人

对话|蓝驰创投曹巍：机器人公司要做有一技之长的“六边形战士”

AI＋家用、商用清洁机器人，下一个蓝海市场！

专访钛虎易港：人形机器人商用元年即将来临！

见证历史！人类首次商业太空行走

专访李青阳：“人工智能＋”时代，数智化赋能产业升级

首个AI大模型供应链安全国际标准发布，蚂蚁、谷歌、百度参与编制

飞行汽车、人形机器人、……这些AI产品亮相外滩大会！

英伟达被美国司法部反垄断调查？最新回应来了！

研学| 抓住“新”制造风口，跑出行业“加速度”

AI＋教育，重塑有教无类范式

大咖云集！机器人创投论坛观点集锦来啦！附中国最具投资潜力机器人公司TOP20名单

一文了解：这些机器人亮相2024年世界机器人大会

反AI产品GPT Zero火了，6个月狂涨300万用户

2024世界机器人大会，倒计时5天开幕！

Open AI官宣GPT-4o上热搜，透露草莓计划进度

AI机器人下单MONA？小鹏官宣机器人最新进展

盘点医疗领域AI大模型：百度、百川智能、讯飞、商汤科技押宝

一笔生成运动轨迹！阿里版“Sore”视频生成框架Tora开源

360与15家AI搜索公司大联合！掰腕GPT-4o

京东云力推8大AI产品，打通大模型最后一公里

蔚来加码AI！5nm芯片、整车全域操作系统赋能智驾

智谱AI推出视频生成模型CogVideoX，30秒即可生成6秒视频

强联智创携AI医疗创新成果亮相2024中关村论坛

新质生产力按下“快进键”，半导体产业发展该走向何方？

商界科创 | 资讯简报

签约！商界科创又与两家重要伙伴牵手

【今日直播预告】2024英伟达GTC见闻与趋势漫谈

【直播预告】2024英伟达GTC见闻与趋势漫谈

商界科创助力强联智创® 赋能科创AI传播新动力

首个面向科创企业的AI传播应用解决方案发布 | 商界科创2024新知TALK昨在上海圆满举行

D轮融资达近亿元，强联智创®为何频获资本青睐?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉