谷歌I/O 2024刚刚宣布的所有产品

财富   2024-05-15 12:38   北京  

  //  

Pixel 8a到具备AI功能的Gmail,再到全新的Firebase Genkit,和生成式AI学习工具......

谷歌每年都会在其开发者大会上用一系列快速的公告开场,包括许多新近开发的项目的首次展示。
由于你可能没有时间观看周二整整两小时的演讲,我们为你快速呈现主题演讲中的重大信息:

Firebase Genkit

Firebase平台新增了一个名为Firebase Genkit的组件,旨在帮助开发者更容易地用JavaScript/TypeScript构建AI驱动的应用,而且很快将支持Go语言。它是一个开源框架,使用Apache 2.0许可证,使开发者能够快速地将AI集成到新的和现有的应用中。

公司在周二强调了Genkit的一些应用场景,包括许多标准的通用人工智能应用案例:内容生成与摘要、文本翻译和图像生成。

AI 到处都是

谷歌的I/O活动在周二进行了110分钟,但谷歌在此期间令人震惊地提到了人工智能121次(这是谷歌自己统计的数字)。首席执行官桑达尔·皮查伊在总结演讲时提到了这个数字,他俏皮地表示,公司正在为我们做“艰苦的统计工作”。再次证明,这并不令人意外,我们已经准备好了。

生成式人工智能用于学习

谷歌还推出了LearnLM,这是一系列全新的“精调”用于学习的生成式AI模型。这是谷歌的DeepMind AI研究部门与谷歌研究所的合作项目。谷歌表示,LearnLM模型旨在“对话式”地辅导学生学习各种科目。

虽然LearnLM已在谷歌的几个平台上可用,但公司正在通过谷歌课堂的试点程序推进LearnLM的应用。公司还在与教育工作者合作,探索LearnLM如何简化并改进课程计划的过程。谷歌表示,LearnLM可以帮助教师发现新的想法、内容和活动,或者找到符合特定学生群体需求的教材。

答题大师

说到教育,YouTube新推出了AI生成的测验功能。这一新的对话式AI工具允许用户在观看教育视频时,形象地“举手”提问。观众可以提出问题以求澄清,获取有用的解释,或者对所学科目进行测验。

对于那些需要观看较长的教育视频,如讲座或研讨会的人来说,这将是一种缓解。得益于Gemini模型的长文本处理能力,这些新功能正在向美国的部分Android用户推出。

Gemma 2 更新

谷歌从开发者那里收到的一个主要请求是需要一个更大的Gemma模型,因此谷歌将在Gemma 2中增加一个新的270亿参数模型。这一下一代谷歌Gemma模型将于6月推出。谷歌表示,这种规模的模型由Nvidia优化,以在下一代GPU上运行,并能在单个TPU主机和Vertex AI上高效运行。

Google Play

Google Play正在引入一些新功能,包括应用发现功能、获取用户的新方式、播放积分(Play Points)的更新,以及针对开发者的工具如谷歌播放SDK控制台和播放完整性API的其他增强功能等。

对开发者特别感兴趣的是一个名为Engage SDK的新工具,它将为应用制作者提供一种方式,以全屏、沉浸式的体验展示他们的内容,这种体验是针对个别用户个性化定制的。不过,谷歌表示,目前用户还无法看到这一界面。

在通话中检测诈骗

周二,谷歌预览了一项新功能,该功能旨在在通话中向用户警示可能的诈骗行为。

这项功能将内置于未来版本的安卓操作系统中,它使用了谷歌生成式AI产品线中最小的版本——Gemini Nano,该版本可以完全在设备上运行。该系统能够实时监听“与诈骗常关联的对话模式”。
谷歌举例说明,如有人假冒“银行代表”。常见的诈骗手段,如要求提供密码和购买礼品卡,也会触发该系统。这些手段广为人知,是骗取金钱的常用方法,但世界上仍有许多人容易受到此类诈骗的侵害。一旦触发,系统将弹出通知,提示用户可能正落入不良人物的圈套。

询问照片

谷歌照片(Google Photos)即将引入一项实验性功能“询问照片”(Ask Photos),这是得益于谷歌的Gemini AI模型的AI融入。这一新功能将于今年夏末推出,允许用户利用自然语言查询来搜索他们在谷歌照片集中的内容,这些查询利用AI对照片内容及其他元数据的理解。

以往用户可以搜索照片中的特定人物、地点或物品,现在得益于自然语言处理技术,AI的升级将使寻找正确内容更加直观,减少手动搜索的过程。

而且示例也很可爱。谁不喜欢一个名为“Golden Stripes”的虎形毛绒玩具和金毛寻回犬组成的乐队呢?

关于Gemini

Gemini 在Gmail中

Gmail用户将能够利用其Gemini AI技术来搜索、总结和草拟他们的电子邮件。它还能够处理更复杂的任务,例如帮助你处理电子商务退货,通过搜索你的收件箱,找到收据并填写在线表格。

Gemini 1.5 Pro

生成式人工智能的又一次升级是,Gemini现在可以分析比以前更长的文档、代码库、视频和音频记录。

在一次新版本Gemini 1.5 Pro的私下预览中,该公司当前的旗舰模型显示,它可以处理高达200万个标记。这是以前最大数量的两倍。凭借这一水平,新版本的Gemini 1.5 Pro支持任何商业可用模型中最大的输入。

Gemini Live

公司预览了Gemini中的一种新体验,名为Gemini Live,它允许用户在智能手机上与Gemini进行“深入”的语音聊天。用户可以在聊天机器人说话时打断Gemini提出澄清问题,它会实时适应他们的语言模式。此外,Gemini能够通过智能手机摄像头捕获的照片或视频,看到并响应用户的周围环境。

乍一看,Live似乎并没有比现有技术有显著的升级。但谷歌声称,它利用生成式AI领域的新技术,提供更优质、更少错误的图像分析——并将这些技术与增强的语音引擎结合使用,以实现更一致、更具情感表达力和现实感的多轮对话。

Gemini Nano

现在有一个小小的公告。谷歌还在将其最小的AI模型Gemini Nano直接内置到Chrome桌面客户端中,从Chrome 126版本开始。公司表示,这将使开发者能够使用设备上的模型来驱动他们自己的AI功能。例如,谷歌计划利用这一新能力来支持现有的工作区实验室(Workspace Lab)中的“帮助我写作”工具等功能。

Gemini在Android上

谷歌的Gemini在Android上,作为Google Assistant的AI替代品,很快将能够充分利用其与Android移动操作系统和谷歌应用深度集成的能力。用户将能够将AI生成的图片直接拖放到他们的Gmail、Google消息和其他应用中。同时,谷歌表示,YouTube用户将能够点击“询问此视频”,以从该YouTube视频中找到具体信息。

Gemini 在 Google 地图上

Gemini模型的功能将引入Google地图平台,首先是Places API。开发者可以在自己的应用程序和网站上展示基于Gemini对Google地图社区(拥有超过3亿贡献者)洞察的分析生成的地点和区域概述。更好的是什么呢?开发者将不再需要编写自己的地点自定义描述。

张量处理单元性能提升

谷歌揭晓了其张量处理单元(TPU)AI芯片的下一代——确切地说,是第六代。这些芯片被命名为Trillium,将于今年晚些时候推出。如果你还记得,宣布TPU的下一代在I/O上几乎已成为一种传统,尽管这些芯片通常会在年底才推出。

这些新的TPU将在每颗芯片的计算性能上实现4.7倍的性能提升,与第五代相比。或许更重要的是,Trillium采用了第三代SparseCore技术,谷歌描述它为“一个专门的加速器,用于处理在高级排名和推荐工作负载中常见的超大嵌入。”

AI在搜索中的应用

谷歌正在其搜索功能中增加更多的AI元素,以消除人们对该公司可能会因为ChatGPT和Perplexity等竞争对手而失去市场份额的疑虑。它正在向美国用户推出由AI驱动的概览。此外,该公司还打算使用Gemini作为旅行规划等事务的代理。

谷歌计划使用生成式AI来组织某些搜索结果的整个搜索结果页面。这是在现有的AI概览功能之外,后者创建了一个简短的摘要,其中包含了你搜索的主题的聚合信息。在谷歌AI实验室项目中试运行一段时间后,AI概览功能将于周二开始向普通用户开放。

生成式人工智能升级

谷歌宣布推出Imagen 3,这是这家科技巨头Imagen生成式AI模型系列的最新产品。

DeepMind的首席执行官Demis Hassabis表示,与前代Imagen 2相比,Imagen 3能更准确地理解其将文本提示转换成图像的过程,并在生成的图像中更具“创造性和细致”。此外,他表示该模型产生的“干扰性艺术效果”和错误更少。

Hassabis还补充说:“这也是我们迄今为止在渲染文本方面最好的模型,这一直是图像生成模型的一个挑战。”

项目IDX

项目IDX是该公司的下一代、以AI为中心的基于浏览器的开发环境,现已进入公开测试阶段。随着这次更新,Google Maps平台被整合到IDE中,帮助开发者为其应用添加地理定位功能,同时还整合了Chrome开发者工具和Lighthouse,以帮助调试应用程序。不久,谷歌还将允许将应用部署到Cloud Run,这是谷歌云为前端和后端服务运行的无服务器平台。

Veo

谷歌正在用Veo对OpenAI的Sora展开竞争,Veo是一款AI模型,能根据文本提示生成大约一分钟长的1080p视频片段。Veo能够捕捉不同的视觉和电影风格,包括风景镜头和延时摄影,并对已生成的影片进行编辑和调整。

它还基于谷歌在视频生成方面的初步商业工作,该工作于四月预览,利用公司的Imagen 2系列图像生成模型创建循环视频片段。

环绕搜索

AI驱动的“环绕搜索”(Circle to Search)功能,允许安卓用户通过手势如圈选等方式获取即时答案,现在能够解决更复杂的物理和数学文字题。这一功能旨在通过一些动作——如圈选、高亮、涂鸦或轻触——使从手机上的任何位置与谷歌搜索互动变得更自然。哦,它还能更好地帮助孩子们直接从支持的安卓手机和平板上完成家庭作业。

Pixel 8a

谷歌迫不及待地在I/O大会前展示了Pixel系列的最新成员,并在上周宣布了新的Pixel 8a。这款手机的起售价为499美元,将于周二开始发货。这次更新也符合我们对这些新版本的期待。首当其冲的是加入了Tensor G3芯片。

Pixel Slate

歌的Pixel平板电脑,名为Slate,现已上市。如果您还记得的话,Brian在去年这个时候评测了Pixel平板电脑,他主要谈论的是底座。有趣的是,这款平板电脑现在可以不带底座购买。TechCrunch







AI新智能
一个致力于探索人工智能对商业世界和社会影响的平台。
 最新文章