谷歌发布Gemini 2.0 Flash,AI交互体验大幅提升
谷歌发布了Gemini 2.0系列模型中的第一个——Gemini 2.0 Flash的实验版本。Gemini 2.0 Flash在保持同样快速响应时间的同时,提供了更强劲的性能表现。2.0 Flash在关键基准测试上不仅超越了1.5 Pro的表现,而且速度提高了一倍。除了支持图像、视频和音频等多模态输入外,2.0 Flash还支持多模态输出,包括原生生成的图文混合内容和可调控的多语言文本转语音功能,并且可以原生调用多种工具,如谷歌搜索、代码执行以及第三方用户自定义函数等。在各项基准测试中,相较于前一代1.5 Pro和1.5 Flash,最新2.0 Flash实现了全面的提升,尤其是代码、数学、推理能力方面。
Gemini 2.0 Flash 2.0 Flash具备了原生的用户交互界面的能力。同时,它还在多模态推理、长文本理解、复杂指令执行与规划组合式函数调用、原生工具调用以及更低的延迟,取得多项技术突破。用户可以获得更加流畅、更直观的AI交互体智能体体验。谷歌正通过不断原型创新,打造出原生用户界面新体验:
Project Astra——今年I/O大会上,谷歌大杀器Project Astra首次亮相,在视觉识别和语音交互上,与GPT-4o几乎不相上下。通过Gemini 2.0,Project Astra可以调用谷歌搜索、Lens和地图功能,让其作为日常生活助手变得更加实用。Project Astra现在可以保持长达10分钟的对话记忆,并能记住更多用户之前的对话内容,从而提供更加个性化的服务。
Project Mariner——从浏览器入手,能够全面感知浏览器屏幕上的各种信息。比如像素级精准识别,以及网页元素(如文本、代码、图像、表单等)智能分析。与Anthropic所展示的Claude 3.5操作计算机界面,执行各种任务的能力几乎一致。
Jules——专为开发者打造的AI代码智能体。随着AI代码助手的迅速发展,它已从基础的代码搜索工具进化为深度融入开发者工作流程的智能助手。
于芳博:中信建投人工智能组首席分析师,北京大学空间物理学学士、硕士,2019年7月加入中信建投,主要覆盖人工智能等方向,下游重点包括智能汽车、CPU/GPU/FPGA/ASIC、EDA和工业软件等方向。
证券研究报告名称:《谷歌发布Gemini 2.0 Flash,AI交互体验大幅提升》
对外发布时间:2024年12月17日
报告发布机构:中信建投证券股份有限公司
本报告分析师:
近期热门视频
更多精彩视频,尽在中信建投证券研究视频号,欢迎关注~
免责声明