首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

不甘示弱！微软祭出小型语言模型Phi-4，在数学竞赛上超过GPT-4o和Gemini1.5

科技 2024-12-13 21:19 北京

文丨都保杰

临近年底，知名公司们的AI产品迭代百花齐放，前有OpenAI Sora引领AI大模型文本生成视频出尽风头，后有谷歌新一代原生多模态模型Gemini 2.0 Flash正式发布搅动市场。

微软终于是坐不住了，好歹得拿出点东西。

12月13日，微软透过一篇论文介绍推出了最新一代专注于复杂推理的小型语言模型：Phi-4，它以较小的尺寸（14B参数）提供了更高质量的结果，除了传统的语言处理外，它还尤其擅长数学等领域的复杂推理。

微软官方介绍，由于整个流程的进步，包括使用高质量的合成数据集、高质量有机数据的整理以及训练后的创新。

Phi-4 在数学推理方面的表现优于同类和更大的模型，例如GPT-4o和Gemini Pro1.5，实现在规模与质量之间取得突破。

论文中提到，大型语言模型（LLM）的最新进展表明，数据质量的显著提高可以与传统上通过用模型和数据集大小缩放计算所获得的性能提升相媲美，有时甚至超过。

微软展示了Phi-4能够进行数学推理的一个例子：

在5只蜗牛的比赛中，最多会出现一次平局，但平局可以涉及任何数量的蜗牛。例如比赛的结果可能是Dazzler第一名，Abby、Cyrus和Elroy并列第二，Bruna排名第五，这场比赛一共有多少种不同的比赛结果？

Phi-4给出了正确计算结果。

虽然OpenAI的GPT-4o和Google的Gemini2.0等较大模型异常火热，但Phi-4表明更小的、简化的架构可以在专门任务中实现卓越的性能。

微软将Phi-4的进步归功于高质量合成数据与人类生成内容数据集的集成，以及训练后未公开的改进，这些努力反映了人工智能行业更广泛的趋势，研究团队越来越关注合成数据使用和训练后优化方面的创新。

今天，公司估值近140 亿美元的Scale AI首席执行官Alexandr Wang也在帖子中预测了这一行业转变，他表示该行业已经遇到了“预训练数据墙”，需要为后训练数据繁荣做好准备，并补充说公司未来将竞相开发更高效的人工智能模型。

如果您有什么想说的，欢迎在评论区留言讨论！

投稿或寻求报道，欢迎私信“投稿”，添加编辑微信。

如果您想要获取最新的科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会！

欢迎扫描下方二维码，添加头部科技创始人、AI头号玩家俱乐部主理人晶总微信！

头部科技是技术新世界的记录者、探索者和推动者。我们致力于普及细分场景的科技解决方案，打造科技和人才创新知识图谱。无论你身处技术公司或传统行业，在这里都可以找到智能化、数字化升级的案例和伙伴。在无限的时空中，和你共同探索科技原力是我们的荣光。

最新文章

CES 2025前瞻：AI无处不在

硬碰硬开局！28家美国实体被列入管制管控名单，1600亿基金再砸硬科技！

惊呆网友！微软论文意外“泄密”OpenAI模型参数引热议，GPT-4o mini仅8B？

WAIC创投生态 | 2025 Future Tech项目路演1月9日名单出炉！

一年亏10亿股价反涨406.45%！国产AI芯片的春天要来了？

OpenAI彻底蜕变！摆脱“非营利”标签束缚或为IPO铺路

2025中关村智能网联汽车创新发展论坛震撼来袭

国产之光刷屏AI圈！DeepSeek-V3成当前最强开源大模型

传ChatGPT将拥有全新“无限”记忆功能？！OpenAI的一篇帖子引热议

2025中关村智能网联汽车创新发展论坛即将开幕！

三分之二产品在用中国芯？美国又针对中国传统芯片下手了

3年半亏损2.5亿，“协作机器人第一股”难当第一

红杉：AI为赚钱发愁搜索成为热点

人才流失！OpenAI资深研究员、初代GPT缔造者Alec Radford离职

涉及20+实验室，打磨2年！华人小伙儿领衔的开源生成式物理引擎Genesis令人惊叹！

国家电网发布国内首个千亿级多模态电力行业大模型

量子计算哪家强？潘建伟、朱晓波等科学家公布“祖冲之3.0”处理器进展对阵谷歌Willow

不服就干！谷歌重磅新品三连发反击OpenAI玩ChatGPT搜索

月付2000美元！OpenAI CFO称博士级AI要来了，能“替代”人类雇员

新能源+数智化浪潮下，信息通信创新如何改变电力行业？

OpenAI长文爆料反击马斯克诉讼：“你不能通过诉讼获得AGI”

不甘示弱！微软祭出小型语言模型Phi-4，在数学竞赛上超过GPT-4o和Gemini1.5

12月20日，上海见｜梧桐荟 “产·投·研”沙龙第6期——芯片级散热技术发展应用与投资机会

Sora试用报告：错误不少，一起找茬

黄仁勋：扫过最多厕所的CEO

“Open AI 12天”上新第4弹：Canvas协作工具正式开放，但实际并没想象中那么好？

刚刚，OpenAI Sora来啦！AI视频新纪元已开启

杨植麟响应仲裁风波，起底人性月之暗面

每月200美金订阅，OpenAI 「十二夜」圈钱忙

大厂小厂肉搏，中国大模型进入淘汰赛

NeurIPS 2024最佳论文！

一图一世界，一飞一菩提

ChatGPT问世2年，我们的世界哪里变了

智能体，大模型进化下一站

从Neuralink开始美国脑机接口研究迎来春天

绿色氢能，零碳飞行

亚马逊向英伟达芯片发起冲锋

AI将进化超级智能，还是逐步崩坏？

为什么能源需要AI？ | 2024能源人工智能创新发展大会圆满举办

AI广告，正在不完美中开创新时代

北京今年最大一笔融资诞生，国产半导体乘风而起

储能沙龙 | 新质生产力与储能行业协同发展及投资机遇沙龙成功举办

蘑菇车联新突破：路侧数据上车，赋能多品牌车辆

具身大模型，国内最大融资诞生

Scaling Law遇阻，AI 性能或难再有大提升

共谋AI未来发展，2024 AI创新应用发展交流会成功举办

AI的尽头，是能源

活动预告 | 梧桐荟 “产·投·研”沙龙第5期——储能产业专场

120亿独角兽，自主工业品牌变身

电力领域出了一个国际级领先技术

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉