人工智能行业点评:“满血”o1大模型重磅亮相,引领新一轮多模态AI迭代浪潮【浙商计算机】

文摘   2024-12-08 21:03   上海  

分析师:刘雯蜀

执业证书号:s1230523020002

研究助理 :陶韫琦

执业证书号:s1230524090010

来源:浙商证券计算机研究团队


具体参见2024年12月7日报告《“满血”o1大模型重磅亮相,引领新一轮多模态AI迭代浪潮——人工智能行业点评报告》,如需报告全文或数据底稿,请联系团队成员或对口销售。




投资要点



北京时间126日凌晨,OpenAI开启为期12天直播活动并在首日上线完整版的o1大模型,并发布ChatGPT Pro服务(订阅价格为每月200美元),模型能力再次实现大幅提升。近期亚马逊、谷歌Deepmind以及国内腾讯、万兴科技等厂商均在多模态AI及应用领域持续迭代,商业化进程有望加速。


1、OpenAI上线完整版o1模型和进阶模式以及ChatGPT Pro订阅服务


北京时间126日凌晨,OpenAI在其举办的“1212场直播”活动首秀中发布完整版o1大模型。o1模型回答用户提问时可形成类似人类思维方式的内部思维链条,从而明显提高回答专业问题的准确性,o1模型回答困难现实问题时出现重大错误的概率可减少34%相比o1-preview,完整版o1模型响应更快且更准确,同时增加了多模态输入的能力。

OpenAI推出ChatGPT Pro,定价为每月200美元。ChatGPT Pro用户可以无限量地使用o1模型(Plus用户限制为每周50条信息),以及无限量使用o1 mini模型和高级语音模式。o1 pro会使用更多的计算资源进入深入思考,并为“最难的问题提供最好的答案”。OpenAI未来计划为模型添加更多更强大、计算密集型的功能。


2、亚马逊、谷歌DeepMind相继发布多模态大模型,应用场景持续延伸


124日的re:Invent大会上,亚马逊AWS发布了新款AI多模态系列大模型Amazon NovaNova一共包含6个模型,其中MicroLite模型能够理解文本、图像和视频输入,适合快速和低成本的交互场景。Pro模型结合多模态能力和高准确性及响应速度,适合视频摘要、软件开发辅助等高级应用。最高端的Premier模型预计将于2025年初发布,旨在处理复杂推理任务。而CanvasReel用于创意任务。Canvas模型能够从文本或图像提示生成专业级图像,Reel模型则能够用自然语言控制风格和摄像机运动,制作短视频。

近日,谷歌DeepMind推出第二代大规模基础世界模型Genie 2,相比于上一代模型,Genie 2在通用性上实现重大突破——能生成丰富多样的3D世界,可以模拟虚拟世界,包括采取任何行动(如跳跃、游泳等)的后果。基于大规模视频数据集进行训练后,Genie2展现出了各种规模的涌现能力,例如物体交互、复杂的角色动画、物理效果、建模、预测其他智能体行为的能力等等。基于Genie 2模型,研究人员可以快速尝试新环境并训练和测试具身AI智能体。


3、近期国内厂商在大模型及产品层面均有升级迭代,关注多模态AI商业化加速


近日,万兴科技旗下视频创意软件Filmora V14版本新增上线超十项AI功能,包括音频成片、图生视频、智能切片、AI翻译唇形驱动、AI文生音效等一系列AI能力,适用于视频博客、教育工作者、营销团队等群体视频创作增效提质。在大模型侧,近日腾讯开源了130亿参数的类Sora文生视频模型HunyuanVideo,具备物理模拟、一镜到底、文本语义还原度高、动作一致性强、色彩分明、对比度高等技术特性,可生成带有音乐的视频。国内厂商多模态模型及产品应用呈现加速迭代趋势。



建议关注标的


AI Agent应用:科大讯飞、彩讯股份、焦点科技、鼎捷数智、泛微网络、拓尔思、迈富时;

AI垂类应用:金山办公、三六零、万兴科技、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W


风险提示


1AI技术迭代不及预期的风险;2AI商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;






法律声明及风险提示

本公众号为浙商证券计算机团队设立。本公众号不是浙商证券计算机团队研究报告的发布平台,所载的资料均摘自浙商证券研究所已发布的研究报告或对报告的后续解读,内容仅供浙商证券研究所客户参考使用,其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,使用本公众号内容应当寻求专业投资顾问的指导和解读,浙商证券不因任何订阅本公众号的行为而视其为浙商证券的客户。

本公众号所载的资料摘自浙商证券研究所已发布的研究报告的部分内容和观点,或对已经发布报告的后续解读。订阅者如因摘编、缺乏相关解读等原因引起理解上歧义的,应以报告发布当日的完整内容为准。请注意,本资料仅代表报告发布当日的判断,相关的研究观点可根据浙商证券后续发布的研究报告在不发出通知的情形下作出更改,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以浙商证券正式发布的研究报告为准。

本公众号所载的资料、工具、意见、信息及推测仅提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,浙商证券及相关研究团队不就本公众号推送的内容对最终操作建议做出任何担保。任何订阅人不应凭借本公众号推送信息进行具体操作,订阅人应自主作出投资决策并自行承担所有投资风险。在任何情况下,浙商证券及相关研究团队不对任何人因使用本公众号推送信息所引起的任何损失承担任何责任。市场有风险,投资需谨慎。

浙商证券及相关内容提供方保留对本公众号所载内容的一切法律权利,未经书面授权,任何人或机构不得以任何方式修改、转载或者复制本公众号推送信息。若征得本公司同意进行引用、转发的,需在允许的范围内使用,并注明出处为“浙商证券研究所”,且不得对内容进行任何有悖原意的引用、删节和修改。


廉洁从业申明:

我司及业务合作方在开展证券业务及相关活动中,应恪守国家法律法规和廉洁自律的规定,遵守相关行业准则,遵守社会公德、商业道德、职业道德和行为规范,公平竞争,合规经营,忠实勤勉,诚实守信,不直接或者间接向他人输送不正当利益或者谋取不正当利益。


计算机蜀你最牛
计算机行业研究
 最新文章