重要提示:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号发布的观点和信息仅供海通证券的专业投资者参考,完整的投资观点应以海通证券研究所发布的完整报告为准。若您并非海通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号推送内容而视相关人员为客户;市场有风险,投资需谨慎。
杨林
海通计算机首席分析师
S0850517080008
Gemini 2.0发布,在低延迟、多模态等方面进步明显。12月12日,谷歌发布 Gemini 2.0系列模型中的第一个模型:Gemini 2.0 Flash 的体验版。这是谷歌的主力模型,具有低延迟特性,而且在谷歌大规模技术前沿中展现了卓越的性能。与1.5 Flash相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强。值得一提的是,2.0 Flash在关键基准测试中甚至超越了1.5 Pro,其速度是1.5 Pro的两倍。同时2.0 Flash还具有新功能,除了能够支持图片、视频和音频等多模态输入,2.0 Flash现在还可以支持多模态输出,例如可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用 Google Search、代码执行以及第三方用户定义的函数等工具。2025年初,谷歌还会将Gemini 2.0扩展到更多Google产品中。
谷歌高度关注AI智能体领域,Gemini 2.0成为重要助力。AI智能体在现实中的应用是一个令人振奋且充满可能性的研究领域。Gemini 2.0使谷歌能够构建新的AI智能体,从而让谷歌离构建通用助手的愿景更进一步。
Project Astra:使用多模态理解现实世界的智能体。Project Astra是谷歌于5月发布的高级视觉和对话响应智能体,其用于构建构建未来的AI助理。基于Gemini 2.0,Project Astra产生了多项改进:更流畅的对话:Project Astra现在可以在多种语言和混合语言之间进行对话,并且能够更好地理解不同口音和生僻单词。新工具的使用:借助Gemini 2.0,Project Astra可以使用Google Search、Google Lens和 Google Maps,从而在日常生活中更好地发挥助手作用。更强的记忆力:谷歌增强了Project Astra的记忆能力,同时确保用户可以掌控对话。现在,它最多可以记住长达10分钟的会话内容,并且可以回忆起过去与它进行的更多对话,以便为用户提供更好的个性化服务。更低的延迟:借助新的流式处理技术和原生音频理解能力,该智能体能够以近于人类对话的延迟来理解语言。
Project Mariner:帮用户完成复杂任务的智能体。Project Mariner是使用 Gemini 2.0构建的早期研究原型,旨在从用户的浏览器开始,探索人机交互的未来。作为研究原型,它能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过实验性的 Chrome 扩展程序使用这些信息为用户完成任务。在 WebVoyager 基准测试(该测试针对智能体在端到端的真实世界网页任务的性能)中,Project Mariner 作为单个智能体设置实现了83.5%的工作效率,达到了最先进的水平。
Jules:面向开发者的智能体。接下来,谷歌会探索人工智能智能体如何通过Jules(一种实验性的AI代码智能体,它可以直接集成到GitHub工作流程中)来协助开发者。它可以解决问题、制定并执行计划,所有这些都在开发者指导和监督下进行。这项工作是谷歌长期目标的一部分,即构建可在所有领域(包括编码)中提供帮助的AI智能体。
游戏和其他领域的智能体。谷歌使用Gemini 2.0构建了智能体,它们可以帮助用户在电子游戏中做出更明智的决策,可以根据屏幕上的实时画面,分析游戏情况,并为用户提供下一步行动建议。谷歌正与Supercell等顶尖游戏开发团队合作,探索智能体在游戏领域的应用。谷歌通过测试它们在各种游戏中的表现,来评估它们理解游戏规则、应对挑战的能力。这些智能体还可以通过Google Search让用户接触到丰富的游戏相关的知识。谷歌还将Gemini 2.0 的空间推理能力应用于机器人领域,尝试让智能体在现实世界中提供帮助。
我们认为,Gemini 2.0在原生用户界面操作能力、多模态推理、长文本理解、复杂指令跟随和规划能力、组合函数的调用,原生工具使用以及延迟优化等一系列领域进行了优化改进,这更使得Gemini 2.0在增强应用能力和构建AI智能体方面拥有了更突出的优势,未来AI应用落地和AI智能体发展也有望持续加速。
风险提示:AI技术发展不及预期,AI应用落地不及预期。
本摘要选自海通证券研究所研究报告:海通计算机 | Gemini 2.0发布,带动谷歌进入“智能体时代”
对外发布时间:2024年12月14日