Google I/O 2024:一切已揭晓,包括 Gemini AI、Android 15 等

学术   2024-05-21 22:43   北京  

原文链接:
https://www.engadget.com/google-io-2024-live-updates-the-latest-on-gemini-ai-android-15-and-more-110008373.html

    在 I/O 大会结束时,谷歌在山景城海岸线露天剧场举行的年度开发者大会上,谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 透露,该公司已经提到“AI”121 次。从本质上讲,这就是谷歌两小时主题演讲的核心——将人工智能融入全球超过 20 亿人使用的每一个谷歌应用程序和服务中。以下是 Google 大型活动的所有主要更新,以及主题演讲后发布的一些其他公告。

Gemini 1.5 Flash 和 Gemini 1.5 Pro 的更新

    谷歌宣布推出名为 Gemini 1.5 Flash 的全新人工智能模型,据称该模型针对速度和效率进行了优化。Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间,后者是该公司在设备上本地运行的最小型号。谷歌表示,它创建 Flash 是因为开发人员想要一种比 Gemini Pro 更轻、更便宜的模型来构建人工智能驱动的应用程序和服务,同时保留一些东西,比如一百万个令牌的长上下文窗口,这些东西使 Gemini Pro 与竞争模型区分开来。今年晚些时候,谷歌将把 Gemini 的上下文窗口增加一倍,达到 200 万个代币,这意味着它将能够同时处理 2 小时的视频、22 小时的音频、超过 60,000 行代码或超过 140 万个单词 。

阿斯特拉计划

    谷歌展示了 Project Astra,这是由人工智能驱动的通用助理的早期版本,谷歌 DeepMind 首席执行官 Demis Hassabis 表示,这是谷歌版本的人工智能代理,“可以在日常生活中提供帮助”。

    在谷歌称是一次性拍摄的一段视频中,一名 Astra 用户在谷歌伦敦办公室周围走动,举起手机,将摄像头对准各种物体——扬声器、白板上的一些代码、窗外——然后 与应用程序就其外观进行自然对话。在视频中最令人印象深刻的时刻之一,它正确地告诉用户她之前把眼镜放在哪里,而用户甚至没有拿起眼镜。

    视频结尾有一个转折——当用户找到并戴上丢失的眼镜时,我们了解到他们有一个机载摄像系统,并且能够使用 Project Astra 与用户无缝地进行对话,这或许表明谷歌可能正在努力 Meta 的雷朋智能眼镜的竞争对手。

询问 Google 照片

    在搜索特定图像或视频时,谷歌照片已经很智能,但通过人工智能,谷歌正在将事情提升到一个新的水平。如果您是美国的 Google One 订阅者,当该功能在未来几个月推出时,您将能够向 Google Photos 提出一个复杂的问题,例如“向我展示我访问过的每个国家公园的最佳照片”。谷歌照片将使用GPS信息以及它自己的“最佳”判断来为您提供选项。您还可以要求谷歌照片生成标题以将照片发布到社交媒体。

Veo 和 Imagen 3

    谷歌新的人工智能媒体创建引擎被称为 Veo 和 Imagen 3。Veo 是谷歌对 OpenAI Sora 的回应。谷歌表示,它可以制作持续时间“超过一分钟”的“高质量”1080p 视频,并且可以理解延时拍摄等电影概念。

    与此同时,Imagen 3 是一个文本到图像生成器,谷歌声称它比之前的版本 Imagen 2 能更好地处理文本。其结果是该公司最高质量的“文本到图像”模型,具有“令人难以置信的细节水平”。逼真、逼真的图像”和更少的伪影——本质上是与 OpenAI 的 DALLE-3 进行竞争。

Google 搜索的重大更新

    谷歌正在对搜索的基本运作方式进行重大改变。今天宣布的大多数更新都包括提出非常复杂的问题的能力(“找到波士顿最好的瑜伽或普拉提工作室,并显示他们的介绍优惠和从灯塔山步行时间的详细信息。”)以及使用搜索来计划膳食和假期 除非您选择加入搜索实验室,否则无法使用,该公司的平台可以让人们尝试实验性功能。

    但谷歌称之为“人工智能概览”的一项重要新功能,该公司已经测试了一年,终于向数百万人推出。谷歌搜索现在将默认在结果之上显示人工智能生成的答案,该公司表示,到今年年底,它将为全球超过 10 亿用户提供该功能。

Android 上的Gemini

    谷歌正在将 Gemini 直接集成到 Android 中。当 Android 15 今年晚些时候发布时,Gemini 将意识到您正在运行的应用程序、图像或视频,您将能够将其作为覆盖层拉出并询问特定于上下文的问题。已经做到这一点的 Google Assistant 会怎样呢?谁知道!谷歌在今天的主题演讲中根本没有提及这个问题。

WearOS 5 电池寿命改进

    谷歌还没有准备好推出最新版本的智能手表操作系统,但它承诺在推出时会对电池寿命进行一些重大改进。该公司表示,如果用户跑马拉松,Wear OS 5 的功耗将比 Wear OS 4 低 20%。Wear OS 4 已经为支持它的智能手表带来了电池寿命的改进,但它在管理设备电源方面仍然可以做得更好。谷歌还为开发人员提供了有关如何节省电量和电池的新指南,以便他们可以创建更高效的应用程序。

Android 15 防盗功能

    Android 15 的开发者预览版可能已经推出数月了,但仍有一些功能即将推出。盗窃检测锁是 Android 15 的一项新功能,它将使用人工智能(又来了)来预测手机盗窃并相应地锁定物品。谷歌表示,其算法可以检测与盗窃相关的动作,例如与抓住手机并逃跑、骑自行车或驾车离开相关的动作。如果 Android 15 手机发现其中一种情况,手机屏幕将快速锁定,从而使手机抢夺者更难访问您的数据。

    还有很多其他更新。谷歌表示,它将在人工智能生成的视频和文本中添加数字水印,使 Gemini 可在 Gmail 和 Docs 的侧面板中访问,为 Workspace 中的虚拟人工智能队友提供支持,监听电话并检测您是否在真实情况下被骗。时间,还有更多。

控制工程研习
好好学习,天天向上
 最新文章