摘要
【宏观角度:政策出台超预期,市场流动性大增】
自9月24日政策一系列政策出台后,市场情绪反转,A股和港股迎来大涨。本周在超预期政策推动下,市场信心得到提振,9月23到27日上证综指上涨12.8%,创2008年12月以来最大单周涨幅。24日至30日上证综指上涨16.5%,9月30日涨幅达到8%,深证成指上涨24.8%,沪深300上涨19.9%,创业板指上涨34.7%,科创50上涨30.8%;港股持续大涨,恒生指数9月23日至27日上涨13%,创近20年来的最大单周涨幅,自9月24日至10月4日涨幅达19.7%。截至9月30日14时30分,沪深两市成交额达23769亿元,突破2015年5月28日全天23625亿元的交易额,刷新A股单日成交记录。
【中观角度:AI算力依旧是主线条】
AI长叙事照旧,前期波动不改长线逻辑。科技产业的完整叙事往往按照“技术突破-爆款应用诞生-需求上扬 -产业景气度高涨”的顺序进行,目前AI叙事正处于海外科技巨头在算力军备竞赛、国内积极追赶走海外映射逻辑的阶段,全球范围内AI爆款应用尚未诞生,仍处于海外技术突破期,AI算力仍旧是目前甚至未来两三年内市场最清晰的主线之一。
市场分歧在哪里?通信及算力的“中军”定位。盘面整体迎来反转,从配置角度出发市场优先选择以房地产和券商为典型代表的顺周期行业以及部分股价低位的行业,TMT尤其是通信及算力板块中的龙头个股前期涨幅较大,投资者担心该品类难以提供足够弹性。我们认为,伴随首轮反转行情稳定,市场有望考虑第二轮重点配置新品类,算力板块凭借板块叙事逻辑和业绩增长确定性有望成为新的选项,同时,展望Q3,光通信产业链个股业绩增速同环比依旧有望高企,在新一轮资金选择中有望成为配置中军。
【微观角度:重视通信二线弹性标的】
上涨吸引增量资金,利好成长方向,龙头“易中天”之外,关注低估值、高增速的二线弹性标的。此次“924组合拳”大超市场预期,引导市场情绪复苏,增量资金大规模进入股市,在资金上升背景下,成长方向有望率先享受资金红利。细分来看,在通信领域AI景气度持续高企的情况下,我们认为,绩优成长性高的科技股有望率先获得资金青睐,以中际旭创、新易盛、天孚通信为主的光模块龙头依旧享有领先优势;此外Q3光模块行业需求有望溢出,将出现龙头领衔、二三线业绩相继释放的情况,叠加去年三季度由于产线准备尚未完善且需求尚未外溢,部分二线光通信企业业绩基数较低,因此我们预计今年Q3部分二线弹性标的或迎来业绩增速爆发期,在增量资金涌入情况下,有望率先进行估值修复,建议关注太辰光、腾景科技、德科立等二线弹性标的。
建议关注:
算力——
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。铜链接:沃尔核材、精达股份。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。液冷:英维克、申菱环境、高澜股份。边缘算力承载平台:美格智能、广和通、移远通信。卫星通信:中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。
数据要素——
运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。
风险提示:AI发展不及预期,算力需求不及预期,市场竞争风险。
1.投资策略:通信配置的进攻性在哪里?
本周建议关注:
算力——
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。
铜链接:沃尔核材、精达股份。
算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。
液冷:英维克、申菱环境、高澜股份。
边缘算力承载平台:美格智能、广和通、移远通信。
卫星通信:中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。
数据要素——
运营商:中国电信、中国移动、中国联通。
数据可视化:浩瀚深度、恒为科技、中新赛克。
本周观点变化:
本周A股和港股迎来大涨,9月23到27日上证综指上涨12.8%,创2008年12月以来最大单周涨幅。本次大涨主要由于9月24日国信办新闻发布会中提到的政策大幅提振市场信心,发布会上央行宣布下调准备金率0.5个百分点,向金融市场提供长期流动性约1万亿元;同时央行创设两大全新的支持资本市场的货币政策工具,设立证券、基金、保险公司互换便利,首期为5000亿元,并设立股票回购、增持再贷款,首期为3000亿元。发布会后,A股与港股全线大涨,24日至30日上证综指上涨16.5%,9月30日涨幅达到8%,深证成指上涨24.8%,沪深300上涨19.9%,创业板指上涨34.7%,科创50上涨30.8%;港股持续大涨,恒生指数自9月24日至10月4日涨幅达19.7%。海外方面,部分科技个股涨幅较明显,其中Meta本周上涨5%,英伟达上涨2.9%,10月3日涨幅达3.4%,主要受益于市场对AI芯片的强劲需求。
2.行情回顾:通信板块上涨,区块链表现最优
本周(2024年9月30日)上证综指收于3336.5点。各行情指标从好到坏依次为:创业板综>万得全A(除金融,石油石化)> 万得全A >中小板综>沪深300>上证综指。通信板块上涨,表现优于上证综指。
从细分行业指数看,区块链、物联网、光通信、云计算、移动互联分别上涨15.8%、15.4%、14.4%、14.3%、13.5%,表现优于通信行业平均水平;卫星通信导航、通信设备、量子通信、运营商分别上涨11.9%、11.2%、8.8%、5.3%,表现劣于通信行业平均水平。
本周,受益华为海四概念,世纪鼎利涨20.043%,领涨版块。受益税务数字化概念,天源迪科上涨20.040%;受益折叠屏、数字货币概念,飞天诚信上涨20.034%;受益动力电池回收概念,南都电源上涨20.030%;受益算力、MLOps概念,东方国信上涨20.027%。
3.周专题:通信配置的进攻性在哪里?
【宏观角度:政策出台超预期,市场流动性大增】
自9月24日政策一系列政策出台后,市场情绪反转,A股和港股迎来大涨。本周在超预期政策推动下,市场信心得到提振,9月23到27日上证综指上涨12.8%,创2008年12月以来最大单周涨幅。24日至30日上证综指上涨16.5%,9月30日涨幅达到8%,深证成指上涨24.8%,沪深300上涨19.9%,创业板指上涨34.7%,科创50上涨30.8%;港股持续大涨,恒生指数9月23日至27日上涨13%,创近20年来的最大单周涨幅,自9月24日至10月4日涨幅达19.7%。截至9月30日14时30分,沪深两市成交额达23769亿元,突破2015年5月28日全天23625亿元的交易额,刷新A股单日成交记录。
【中观角度:AI算力依旧是主线条】
AI长叙事照旧,前期波动不改长线逻辑。科技产业的完整叙事往往按照“技术突破-爆款应用诞生-需求上扬 -产业景气度高涨”的顺序进行,目前AI叙事正处于海外科技巨头在算力军备竞赛、国内积极追赶走海外映射逻辑的阶段,全球范围内AI爆款应用尚未诞生,仍处于海外技术突破期,AI算力仍旧是目前甚至未来两三年内市场最清晰的主线之一。
市场分歧在哪里?通信及算力的“中军”定位。盘面整体迎来反转,从配置角度出发市场优先选择以房地产和券商为典型代表的顺周期行业以及部分股价低位的行业,TMT尤其是通信及算力板块中的龙头个股前期涨幅较大,投资者担心该品类难以提供足够弹性。我们认为,伴随首轮反转行情稳定,市场有望考虑第二轮重点配置新品类,算力板块凭借板块叙事逻辑和业绩增长确定性有望成为新的选项,同时,展望Q3,光通信产业链个股业绩增速同环比依旧有望高企,在新一轮资金选择中有望成为配置中军。
【微观角度:重视通信二线弹性标的】
上涨吸引增量资金,利好成长方向,龙头“易中天”之外,关注低估值、高增速的二线弹性标的。此次“924组合拳”大超市场预期,引导市场情绪复苏,增量资金大规模进入股市,在资金上升背景下,成长方向有望率先享受资金红利。细分来看,在通信领域AI景气度持续高企的情况下,我们认为,绩优成长性高的科技股有望率先获得资金青睐,以中际旭创、新易盛、天孚通信为主的光模块龙头依旧享有领先优势;此外Q3光模块行业需求有望溢出,将出现龙头领衔、二三线业绩相继释放的情况,叠加去年三季度由于产线准备尚未完善且需求尚未外溢,部分二线光通信企业业绩基数较低,因此我们预计今年Q3部分二线弹性标的或迎来业绩增速爆发期,在增量资金涌入情况下,有望率先进行估值修复,建议关注太辰光、腾景科技、德科立等二线弹性标的。
4. 我国算力总规模达246EFLOPS 超过830万标准机架
据C114报道,在日前召开的“2024中国算力大会开幕式”上,工业和信息化部总工程师赵志国在致辞中表示,工业和信息化部紧紧锚定以中国式现代化全面推进强国建设,民族复兴伟业的中心任务,紧紧锚定实现高质量发展的首要任务,紧紧锚定推进新型工业化的关键任务,引领信息通信产业不断巩固优势,开拓蓝海,蹄疾步稳,蓬勃向前。
坚持创新发展理念,5G技术产业成为我国实现领跑的产业领域,工业互联网信息化发展走在了世界的前列,建成全国规模最大,技术先进的双千兆网络,培育世界领先的数字消费市场。在算力领域全国占用算力中心机架总规模超过了830万标准机架,算力总规模达到了246EFLOPS,位居世界的前列,产业发展不断提质增效向新。
坚持协调发展的理念。电信普遍服务深入推进,城乡协调发展取得了历史性突破,工业互联网布局与各地区资源禀赋、产业优势深度融合,服务国家区域战略取得了关键性的进展。在算力领域互联互通纵深推进,城域算力节点级1毫秒的时延保障能力逐渐形成,区域集群到周边主要城市之间5毫秒时延保障的能力广泛的覆盖,国家枢纽节点间20毫秒时延的保障能力已全面实现。
坚持绿色发展的理念。绿色化改造的步伐加快,数据中心等重要基础设施更新升级,在采矿、钢铁等行业形成了一批节能减排的典型应用,在算力领域全国算力中心平均电能利用效率,也就是PUE降至1.47,创建国家绿色数据中心246个,超140个算力中心绿色低碳登记达到了4A级以上的标准,为全球数字社会健康可持续发展作出了积极的贡献。
坚持开放发展的理念。统筹好国内国际两个市场,两种资源,创新监管的方式,不断优化行业监管的环境。纵深推进增值电信业务市场的开放试点,在算力领域推进互联网数据中心等重点业务分阶段、分地区试点,取消外资的股比限制,吸引外资企业、民营企业等积极参与算力产业发展的方阵,形成资源共享、平台共建、价值共创的产业发展的新生态。
坚持共享发展的理念。5G、工业互联网等深度融入76个国民经济的大类,在培育经济新模式的同时5G+远程医疗,5G+远程教育等创新应用助力公共资源获得更加均等,更加便利,更加公平。在算力领域,工业、教育、医疗、能源等多个领域的算力应用项目超过了1.3万个,有力支撑了人工智能的快速发展,为在更大范围、更高水平上共享数字化发展的成果奠定了坚实的基础。
5.三星首款AI平板电脑搭载联发科天玑9300+芯片
据C114报道,三星电子发布了其首款支持AI的平板电脑Galaxy Tab S10系列,该系列搭载了联发科生产的高端天玑9300+应用处理器(AP)。这款新平板电脑的推出,标志着三星首次使用联发科天玑AP为其移动设备提供支持。此前,这三星在其高端Galaxy Tab系列中使用了高通骁龙芯片。
分析师表示,三星转向与联发科合作,以在与高通和其他AP供应商的价格谈判中占据上风。
三星最新平板电脑有两个类型Galaxy Tab S10 Ultra和Galaxy Tab S10+,分别配备14.6英寸显示屏和12.4英寸显示屏,均采用尖端动态AMOLED 2X技术。
三星表示,Galaxy Tab S10系列平板电脑与S Pen手写笔捆绑销售,是专为人工智能(AI)打造的。与上一代Galaxy Tab S9 Ultra相比,Galaxy Tab S10 Ultra的性能升级包括中央处理器(CPU)提升18%,图形处理器(GPU)提升28%,神经处理器(NPU)提升14%。S Pen的Air Command with AI功能可即时访问Galaxy AI Assistant功能,而无需在菜单之间切换。Galaxy Tab S10系列提供的新功能之一是Galaxy AI Key。
AI Assistant应用程序可以通过Book Cover Keyboard上的Galaxy AI Key轻松启动,并提供提示,让用户更轻松地在三星的Bixby和谷歌Gemini之间进行选择,以获得定制的AI体验。其他尖端AI功能包括针对平板电脑外形优化的Note Assist和Drawing Assist。
三星表示,平板电脑系列的四扬声器设置通过AI驱动的“对白增强”得到进一步增强,它可以放大声音以消除不必要的噪音,从而产生超清晰的音频。
与谷歌联合开发的人工智能圆圈搜索功能也应用于Galaxy Tab S10系列。使用圆圈搜索,用户无需切换应用程序即可搜索任何内容。三星表示,使用更宽屏幕的两个部分,用户可以翻译任何图像、视频或文本。
Galaxy Tab S10系列还可以充当智能家居设备,具有3D地图视图,可以直观地概览家庭和所有连接设备,从而简化整个SmartThings生态系统的设备管理。用户还可以启用SmartThings Energy和AI能源模式来监控设备的能耗。三星Knox安全技术可确保数据隐私。
Galaxy Tab S10 Ultra和Galaxy Tab S10+将于10月3日起在特定市场上市,提供两种颜色——月光灰和铂金银。Galaxy Tab S10 Ultra 256GB型号售价1199.99美元,512GB型号售价1319.99美元,1TB型号售价1619.99美元;Galaxy Tab S10+ 256GB型号售价999.99美元,512GB型号售价1119.99美元。借助AI平板电脑,三星旨在缩小与行业领导者苹果iPad的市场份额差距。
6. LightCounting:电信光模块市场有复苏迹象
据C114报道,近日,光通信行业市场研究机构LightCounting在最新报告中指出,2024年第二季度全球光模块销售额超过30亿美元,较去年同期增长10亿多美元。
LightCounting认为,增长主要来自于以太网光模块,特别是对400G和800G光模块的强劲需求,整体来看以太网光模块的销售额同比增长100%。不过下半年增速将有所放缓,主要是去年下半年开始整个市场开始增长,因此今年下半年很难有翻番的增长。
与此同时,面对市场需求,领先的光模块供应商必须达到每通道100G模块的产能极限,同时开始规划每通道200G的光模块。另外,元器件的供应短缺也将限制增长。
以太网光模块需求的高速增长,主要来自于领先的云计算公司的资本开支。2024年第二季度,阿里巴巴和Alphabet的资本开支同比增长超过90%,微软增长55%。在此驱动下,英伟达的收入同比增长122%,博通公司的收入同比增长47%。
电信领域的光模块市场需求仍然不足,但有复苏的迹象,预计2024年下半年的需求将趋于稳定。电信设备供应商的总收入同比下降6%,但环比增长14%。
7. 英特尔发布至强6性能核处理器,携手生态加速数据中心算力升级
据C114报道,9月26日,今日,英特尔正式发布英特尔® 至强® 6性能核处理器(代号Granite Rapids),为AI、数据分析、科学计算等计算密集型业务提供卓越性能。发布会上,英特尔联合生态合作伙伴分享了基于全新英特尔至强6处理器在云计算、数据中心架构创新、绿色可持续发展等诸多领域的应用实践,并携手多家产业伙伴进行了联合发布。
期间,英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示,“面对AI时代对更高质量和更多元化的算力需求,英特尔推出全新至强6性能核处理器。凭借强大的计算密度、领先的单核性能、更高的内存带宽和I/O以及出色的能效,至强6性能核处理器能够应对数据中心丰富多样的工作负载挑战。在推动基础设施创新的同时,英特尔亦持续从打造解决方案到构建行业统一标准等多维度,助力高能效数据中心发展。”
性能升级,满足广泛应用需求
英特尔® 至强® 6性能核处理器专为计算密集型工作负载而设计。相比上一代处理器,至强6性能核处理器的性能翻倍1,并凭借更多的核心数量、双倍内存带宽、内置的AI加速功能,满足从边缘到数据中心再到云环境中的各种严苛AI挑战。采用模块化SoC架构设计,至强6性能核处理器以丰富的产品系列,为云服务提供商、OEM、ODM、ISV等提供高度的灵活性和可扩展性。
在云计算领域,英特尔至强6处理器在每路核心数、单核性能、每瓦性能方面,相比上一代处理器均有显著提升,可帮助云服务提供商有效降低计算成本。与第五代英特尔® 至强® 可扩展处理器相比,至强6处理器拥有多达2倍的每路核心数,平均单核性能提升高达1.2倍,平均每瓦性能提升高达1.6倍,同等性能水平下平均节省30%的TCO2。同时,在数据中心常见的通用计算、数据和Web服务、科学计算和AI等工作负载中,至强6性能核处理器在性能和每瓦性能上,相比上一代处理器也有显著提高3。
9月26日宣布上市的至强6900P系列处理器(代号Granite Rapids-AP),最高配备128个内核,支持高达每秒6400MT的DDR5内存、每秒8800MT的MRDIMM内存、6条UPI 2.0链路(速率高达每秒24 GT),96条PCIe 5.0或64条CXL 2.0通道、504MB的L3缓存,支持FP16数据格式的英特尔® 高级矩阵扩展(英特尔® AMX),可为AI和科学计算等内存带宽敏感型工作负载提供MRDIMM选择,且新增对CXL 2.0的支持。
携手生态,驱动数据中心演进
算力作为新型生产要素,结合数据和算法,通过智能化引发经济范式的转变,为新质生产力的爆发提供了关键驱动力,是新质生产力的重要构成。
“作为算力的载体,数据中心在过去近20年中,通过不断地演进与重构见证和推动了科技的发展,”英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉表示,“英特尔通过平台和产品的迭代升级,不断优化数据中心架构。在算力需求日益多样化和海量化发展的当下,英特尔通过至强6性能核处理器的发布,与生态伙伴共同探索数据中心系统架构的升级,进一步释放算力价值。”
8. 端侧最强开源AI模型Llama3.2登场:可在手机运行,从1B纯文本到90B多模态,挑战OpenAI 4o mini
据C114报道,Meta 9月25日发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。
Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs (11B 和 90B),以及轻量级纯文本模型(1B 和 3B),此外提供预训练和指令微调(instruction-tuned)版本。
4 个版本 AI 模型简介如下:
Llama 3.2 90B Vision(文本 + 图像输入):Meta 最先进的模型,是企业级应用的理想选择。该模型擅长常识、长文本生成、多语言翻译、编码、数学和高级推理。它还引入了图像推理功能,可以完成图像理解和视觉推理任务。该模型非常适合以下用例:图像标题、图像文本检索、视觉基础、视觉问题解答和视觉推理,以及文档视觉问题解答。
Llama 3.2 11B Vision(文本 + 图像输入):非常适合内容创建、对话式人工智能、语言理解和需要视觉推理的企业应用。该模型在文本摘要、情感分析、代码生成和执行指令方面表现出色,并增加了图像推理能力。该模型的用例与 90B 版本类似:图像标题、图像文本检索、视觉基础、视觉问题解答和视觉推理,以及文档视觉问题解答。
Llama 3.2 3B(文本输入):专为需要低延迟推理和有限计算资源的应用而设计。它擅长文本摘要、分类和语言翻译任务。该模型非常适合以下用例:移动人工智能写作助手和客户服务应用。
Llama 3.2 1B(文本输入):Llama 3.2 模型系列中最轻量级的模型,非常适合边缘设备和移动应用程序的检索和摘要。该模型非常适合以下用例:个人信息管理和多语言知识检索。
其中 Llama 3.2 1B 和 3B 模型支持 128K 标记的上下文长度,在边缘本地运行的设备用例(如摘要、指令跟踪和重写任务)中处于领先地位。这些模型在第一天就支持高通和联发科硬件,并针对 Arm 处理器进行了优化。
与其他开源多模态模型不同的是,预训练模型和对齐模型都可以使用 torchtune 针对自定义应用进行微调,并使用 torchchat 进行本地部署。开发者还可以使用智能助手 Meta AI 试用这些模型。
Meta 将分享首批 Llama Stack 官方发行版,这将大大简化开发人员在不同环境(包括单节点、内部部署、云和设备)中使用 Llama 模型的方式,实现检索增强生成(RAG)和工具支持型应用的交钥匙部署,并集成安全性。
Meta 一直在与 AWS、Databricks、Dell Technologies、Fireworks、Infosys 和 Together AI 等合作伙伴密切合作,为他们的下游企业客户构建 Llama Stack 发行版。设备分发通过 PyTorch ExecuTorch,单节点分发通过 Ollama。
9. OpenAI推出ChatGPT高级语音模式 付费使用且限制对话时长
据C114报道,ChatGPT已经为更自然的语音聊天做好了准备。OpenAI上周二表示,其流行的聊天机器人现在为付费用户提供了高级语音功能,该工具使对话更加流畅。该版本将在本周持续发布。该公司表示,欧盟国家、冰岛、列支敦士登、挪威、瑞士和英国尚未提供该功能。
OpenAI于今年5月宣布了这项新功能。这项新功能的推出引起了广泛关注,因为一个名为Sky的声音与2013年电影《她》中斯嘉丽·约翰逊(Scarlett Johansson)的声音十分相似。代表约翰逊的法律顾问给OpenAI发函,声称该公司无权使用这种近乎相同的声音,OpenAI暂停在其产品中使用这种声音。
此后的几个月里,人们可以通过免费版配置ChatGPT,让它以其他声音与自己对话。高级版本的响应速度更快,如果你打断它,它就会停止说话并倾听。现在有九种声音可供选择,你可以在应用设置的自定义部分输入语音聊天的指令。
OpenAI的联合创始人兼CEO Sam Altman周二在一篇X帖子中写道:“希望你觉得等待是值得的。”
对于得到微软支持的OpenAI来说,这是一个竞争日益激烈的领域。过去几周,谷歌在安卓设备上发布了自己的Gemini Live英语语音功能。本周一有报道称,Meta将在本周晚些时候推出名人语音,可以通过Facebook、Instagram和WhatsApp访问。
OpenAI于2022年底推出了ChatGPT,在生成式人工智能聊天机器人市场占据了先机。今年8月,OpenAI向媒体透露,ChatGPT的周活跃用户已超过2亿。
只有订购了OpenAI的Plus、Team或Enterprise计划的用户才能使用高级模式。最经济实惠的方案是Plus级,每月20美元。
OpenAI表示,它已经改进了一些外语的口音,并提高了对话速度。但是,如果你不喜欢听到的内容,你可以要求ChatGPT换一种说法。比如,你可以让它加快语速,或者加入地方口音。有了高级语音模式,你可以让ChatGPT给你讲睡前故事,帮你为求职面试做好准备,甚至还可以训练你的外语技能。
10.Gemini 1.5 AI模型再进化:成本更低、性能更强、响应更快
据C114报道,科技媒体 The Decoder 9月24日发布博文,报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。
谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模型的速率限制,并减少了延迟。
新款模型的性能情况如下:
在更具挑战性的 MMLU-Pro 基准测试中,模型的性能提高了约 7%。
在 MATH 和 HiddenMath 基准测试中,数学性能显著提高了 20%。
视觉和代码相关任务也有所改进,在视觉理解和 Python 代码生成评估中提高了 2-7%。
谷歌声称,这些模型现在能在保持内容安全标准的同时,提供更有帮助的回复。该公司根据开发人员的反馈意见,改进了模型的输出风格,旨在实现更精确、更经济高效的使用。
谷歌还升级了 8 月发布的 Gemini 1.5 实验模型,推出了 Gemini-1.5-Flash-8B-Exp-0924升级版,进一步增强了文本和多模态应用。
11.OpenAI o1 AI模型PlanBench规划能力实测:准确率97.8%,远超LLaMA 3.1 405B创造的62.6%纪录
据C114报道,来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。
PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。
在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA 3.1 405B(准确率为 62.6%)。
研究人员还测试了一种新的随机变体,以排除 o1 的性能可能源于其训练集中的基准数据。在这次测试中,O1 的准确率降至 37.3%,但仍远远超过了得分接近零的其它模型。
随着任务越来越复杂,o1 的表现也急剧下降。在需要 20 到 40 个规划步骤的问题上,o1 在较简单测试中的准确率从 97.8% 下降到只有 23.63%。
该模型在识别无法解决的任务方面也很吃力,只有 27% 的时间能够正确识别。在 54% 的情况下,它错误地生成了完整但不可能完成的计划。
虽然 o1 在基准性能上实现了“量子改进”(Quantum improvement),但它并不能保证解决方案的正确性。如快速向下算法等经典的规划算法,可以在更短的计算时间内实现完美的准确性。
研究还强调了 o1 的高资源消耗,运行这些测试需要花费近 1900 美元,而经典算法在标准计算机上运行几乎不需要任何成本。
研究人员强调,对人工智能系统进行公平比较必须考虑准确性、效率、成本和可靠性。他们的研究结果表明,虽然像 o1 这样的人工智能模型在复杂推理任务方面取得了进步,但这些能力还不够强大。
十二、风险提示
AI发展不及预期,算力需求不及预期,市场竞争风险。
本文节选自国盛证券研究所已于2024年10月6日发布的报告《国盛通信丨通信配置的进攻性在哪里?》,具体内容请详见相关报告。