【西部计算机】推理层面的Scaling Law，正在出现

科技 2024-09-14 16:22 广东

特别声明

特别声明《证券期货投资者适当性管理办法》、《证券经营机构投资者适当性管理实施指引(试行)》于2017年7月1日起正式实施。通过新媒体形式制作的本公众号推送信息仅面向西部证券的专业投资者。若您并非西部证券的专业投资者。请取消关注本公众号，不再订阅、接收或使用本公众号中的任何推送信息。因本公众号受限于访问权限的设置，若给您造成不便，烦请谅解!感谢您给予的理解与配合。

核心观点

北京时间2024年9月13日，OpenAI发布o1系列大模型，同时在技术博客《Learning to Reason with LLMs》中对o1模型做了详细介绍。

· o1系列模型是OpenAI首个经过强化学习训练的模型——它在输出回答前会思考，会在产生一个很长的内部思维链。

与人在回答难题之前进行长时间思考类似，o1 在尝试解决问题时会使用思维链。通过强化学习，o1学会了：1）完善思维链并改进策略；2）学会了识别和纠正错误；3）将困难的步骤分解为更简单的步骤；4）在当前方法不起作用时尝试不同的方法。这个过程极大地提高了模型的推理能力。

· 推理层面的Scaling Law正在出现，即推理（思考）的增加也能大幅提高模型的性能。

大规模的强化学习可以教会大模型如何在高数据效率的训练过程中使用其思维链进行高效思考。OpenAI在技术报告中表示，随着强化学习（训练时计算）的增加和思考时间的增加（测试时计算），o1的性能会不断提高，也就是说模型可以通过推理阶段更多的思考来提升逻辑推理能力，做出更优质的决策和回答。

· o1系列包含o1、o1-preview和o1-mini三款模型，o1-mini未来或将免费开放。

1）o1：该系列最强的模型，暂未对外公开；2）o1-preiview：o1的早期版本，可以立即提供给ChatGPT付费用户和API用户，目前每位用户每周仅能给 o1-preview 发送 30 条消息；3）o1-mini：是一个更小的模型，在预训练期间针对 STEM 推理进行了优化，速度更快，擅长编程；性价比更高，整体来看，o1-mini 的成本比 o1-preview 低 80%；目前每周只能发50条消息。OpenAI 表示，未来将向所有 ChatGPT 免费用户提供 o1-mini 的访问权限。

· 在编程、数学等需要强推理能力的领域，o1模型表现优异。

在许多推理为主的基准测试中，o1 的表现甚至可以与人类专家媲美。在 2024 年的 AIME （美国顶尖高中数学竞赛）中，GPT-4o 平均能解决 12%（1.8/15）的问题，而 o1 能解决超70%的问题，甚至在使用学习的评分函数对 1000 个样本重新排序后能达到了 93%（13.9/15），排名全美前 500 名。在 GPQA Diamond （智力基础测试，用于测试化学、物理和生物方面的专业知识）中，o1 的表现超过了一些人类专家，成为第一个在该基准测试中实现达到此成就的模型。编程领域，基于o1进行了初始化并进一步训练了其编程技能后，OpenAI 得到了一个非常强大的编程模型（o1-ioi），该模型在 2024 年国际信息学奥林匹克竞赛（IOI）赛题上得到了213分，达到了排名前49%的水平。

相关公司

寒武纪、海光信息、工业富联。

风险提示

技术进展不及预期、应用落地不及预期、行业竞争加剧。

西部证券—投资评级说明

分析师声明

免责声明

研究报告来源

证券研究报告：《计算机行业周观点第23期 -- 推理层面的Scaling law，正在出现》

对外发布时间：2024年9月13日

对外发布机构：西部证券研究发展中心

参与人员信息：

分析师：郑宏达

执业编号：S0800524020001

邮箱：zhenghongda@research.xbmail.com.cn

联系人：卢可欣

邮箱：lukexin@research.xbmail.com.cn

本公众号推送内容仅面向西部证券股份有限公司（以下简称“西部公司”）机构客户，请勿对本公众号内容进行任何形式的转发。若您并非西部证券机构客户，请取消关注本公众号，不再订阅、接收或使用本公众号中的内容。因本公众号难以设置访问权限，若给您造成不便，烦请谅解！西部证券不会因订阅本公众号的行为或者收到、阅读本公众号推送内容而视相关人员为客户。

本公众号内容基于已公开的信息编制，但作者对该等信息的真实性、准确性及完整性不作任何保证。本公众号所载的意见、评估及预测仅为出具日的观点和判断，该等意见、评估及预测在出具日外无需通知即可随时更改。在不同时期，西部证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。同时，本公众号所指的证券或投资标的的价格、价值及投资收入可能会波动。西部证券不保证本公众号所含信息保持在最新状态。对于西部证券其他专业人士（包括但不限于销售人员、交易人员）根据不同假设、研究方法、即时动态信息及市场表现，发表的与本公众号不一致的分析评论或交易观点，西部证券没有义务向本公众号所有接收者进行更新。西部证券对本公众号所含信息可在不发出通知的情形下做出修改，投资者应当自行关注相应的更新或修改。

在任何情况下，本公众号所载的观点、结论和建议仅供投资者参考之用，并非作为购买或出售证券或其他投资标的的邀请或保证。客户不应以本公众号取代其独立判断或根据本报告做出决策。该等观点、建议并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求，在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况，并完整理解和使用本公众号内容，不应视本公众号为做出投资决策的唯一因素，必要时应就法律、商业、财务、税收等方面咨询专业财务顾问的意见。西部证券以往相关研究报告预测与分析的准确，不预示与担保本公众号及西部证券今后相关研究报告的表现。对依据或者使用本公众号及西部证券其他相关研究报告所造成的一切后果，西部证券及作者不承担任何法律责任。

本公众号版权仅为西部证券所有。未经公司书面许可，任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号版权。如征得西部证券同意进行引用、刊发的，需在允许的范围内使用，并注明出处为“西部证券研究发展中心”，且不得对本公众号进行任何有悖原意的引用、删节和修改。如未经西部证券授权，私自转载或者转发本公众号，所引起的一切后果及法律责任由私自转载或转发者承担。西部证券保留追究相关责任的权力。本公司具有中国证监会核准的“证券投资咨询”业务资格，经营许可证编号为：91610000719782242D。

http://mp.weixin.qq.com/s?__biz=MzA3MzAzNjgzMg==&mid=2651013329&idx=1&sn=22a6b6966c85d1d9fdb4738c979b7ef6

宏达说

中国科技发展的大时代！西部证券分析师郑宏达（证券投资咨询(分析师）：S0800524020001）

最新文章

【西部科技】汇顶科技：收购云英谷实现优势互补，强强联合迈向互利共赢

【西部科技】AI应用的to B和to C

【西部计算机】软通动力：Q3业绩超预期，软硬一体化战略驱动成长

【西部科技】（深度）传音控股：新兴市场手机领军者，多元化增长策略前景可期

【西部计算机】浪潮信息：收入利润高速增长，积极增加经营备货

【西部计算机】AI应用聚焦场景

（重磅深度）交互型多模态大模型有望带来应用的爆发起点

【西部计算机】企业级搜索是AI Agent重要场景

【西部计算机】国产人形机器人加速推进，关注“芯片+软件+场景”增量

【西部计算机】计算机行业2024年三季报总结

【西部科技】领益智造：三季度利润显著改善，端侧AI拉动下业绩增长可期

【西部科技】工业富联：AI算力需求强劲，云计算业务持续增长

【西部计算机】金山办公：Q3业绩符合预期，AI商业化稳步推进

【西部科技】寒武纪：单季度营收同比大幅增长，存货显著提升

【西部计算机】（深度）浪潮信息：服务器行业领军者，有望实现AI驱动的高确定性增长

【西部科技】大华股份：短期利润承压，静候市场需求回暖

【西部计算机】11月观点：美股科技大厂发布财报，AI景气度持续

【西部科技】立讯精密：Q3业绩表现符合预期，AI驱动多项业务齐头并进

【西部科技】海康威视：收入增长有所放缓，回购与增持彰显长期信心

【西部科技】圣邦股份：24Q3利润同比高增，业绩符合预期

【西部科技】达梦数据：三季度业绩超预期，信创景气度持续验证

【西部科技】水晶光电：24Q3业绩超预期，多元布局成长动力充足

【西部科技】中控技术：单季营收增速放缓，费用管控效果依旧显著

计算机行业2024Q3持仓分析：低配幅度进一步扩大

【西部科技】汇顶科技：前三季度利润提升明显，多款新品厚积薄发

【西部科技】（深度）水晶光电：消费电子行稳致远，AR、汽车进而有为

【西部计算机】科大讯飞：业绩符合预期，前三季度营收同比稳步增长

【西部科技】科技自立自强

【西部科技】降息周期下的美股科技股交易策略

【西部科技】特斯拉Cybercab亮相，纯视觉驱动端到端算法运行

【西部科技】（深度）汇顶科技：多元布局汇通四海，指纹/触控顶立新峰

【西部计算机】政策持续加码，数据要素落地进展可期

【西部科技】计算机行业的股价强弹性和标的选择

【西部科技】科技板块估值中枢有望上移，关注两大策略

【西部计算机】（深度）海康威视：智能物联领导者，积极赋能数字化转型

【西部科技】AI智能眼镜系列报告（二）：多模态大模型有望改变智能眼镜发展路径

【西部计算机】（深度）达梦数据：久久为功，国产数据库龙头蓄势待发

【西部科技】（深度）电连技术：消费电子+汽车电子共振，催生连接器领域国产领先者

【西部科技】电子行业2024年中报总结：行业景气度改善，基本面复苏趋势明显

【西部计算机】推理层面的Scaling Law，正在出现

【西部计算机】（深度）柏楚电子：智驭激光，创领未来

【西部计算机】计算机行业2024年中报深度解析

【西部科技】寒武纪：亏损同比收窄，基础软件系统平台持续优化

【西部科技】（深度）鹏鼎控股：端侧AI驱动鹏飞万里，汽车/服务器助力鼎创未来

【西部科技】科技自主的道路是星辰大海

【西部计算机】中控技术：海外业务不断拓展，“AI+数据 ”核心竞争力继续夯实

【西部计算机】广联达：控费效果显现，Q2单季归母净利润同比增速转正

【西部科技】（深度）工业富联：智能制造先行者，AI算力需求强提供高确定性增长

【西部计算机】美股软件股目前的估值和股价表现

【西部计算机】金山办公：WPS AI 进展亮眼，合同负债表现良好支撑后续成长

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉