谷歌 Pixel 9 手机系列,AI功能超出预期

文摘   2024-08-15 07:24   北京  

谷歌在Made by Google活动上发布了新系列智能手机:Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL和Pixel 9 Pro Fold,有许多新功能。不出所料,人工智能融入了许多好玩的新功能中。

从外观上看,新款Pixel 9 Pro造型时尚,侧面平坦,边缘圆润(与 iPhone 非常相似),并配有柔软的磨砂玻璃。它们有几种相当中性的颜色,包括深灰色、浅灰色、瓷白色、黑色和粉红色。就物理尺寸而言,Pixel 9、9 Pro 和 9 Pro XL 都非常相似,XL 仅比 Pro 大半英寸。 

1. 全新 AI 驱动的 Pixel 截图功能

使用 Google Pixel 9 Pro 中的屏幕截图应用程序。

Pixel 9 Pro 上最令人印象深刻的新功能之一旨在解决我们都面临的一个问题:管理屏幕截图。从历史上看,屏幕截图与照片一起存在,同时占用手机上的大量空间,这不是很方便用户使用。Pixel 9 Pro 中的 Pixel Screenshots 应用程序通过将您拍摄的所有屏幕截图放在一个地方来解决组织问题,并利用 AI 使导航更容易。 

2. Gemini Live 

谷歌在今年早些时候的I/O 大会上展示了其多模态 AI 模型,引起了广泛关注,但随着新款 Pixel 9 Pro 的发布,等待已经基本结束。Gemini 取代了 Live,采用自然对话模型的完全多模态 AI 来实时响应用户的查询。这意味着您可以按照自己的节奏提出问题,并通过要求澄清、更改主题或在需要时停止 Gemini 的响应来提示 AI 做出响应。

使用 Gemini 语音对话会在 Pixel 9 系列手机上使用 Gemini 调用“开始直播”。不过,值得注意的是,该人工智能旨在集成为应用程序及其功能提供支持的总体存在,而不是位于屏幕角落的孤立虚拟助手。   

Gemini 将提供通话摘要等功能,以及文本和电子邮件摘要、翻译功能、前面提到的屏幕截图功能,当然还有圆圈搜索功能。

谷歌还将为所有新 Pixel 9 用户免费提供一年的 Gemini Advanced AI 模型。  

3. Pixel Studio 和新的视觉 AI 功能

新款Pixel 9 Pro和9 Pro XL的相机硬件与上一代基本相同,但软件包含一些升级的 AI 视觉功能,使这款手机与众不同。Pixel 9 Pro 的方法是利用 AI 以易于理解的方式进行操作,这一点在新的 Magic Editor 应用程序中得到了充分体现。  

Reimagine 可以让你将生成式 AI 应用于自己的照片,例如,让你将自拍照的背景从卧室墙壁更改为美丽的日落。 

“添加我”功能使用人工智能将两张照片融合在一起,将原本不在场的人添加到集体照中。我在实际使用 Pixel 9 Pro 时演示了这项功能,发现它非常聪明有趣,但我需要做更多测试才能知道照片效果如何。 

Video Boost,Pixel 的视频升级功能在 9 Pro 上得到了改进,使用机器学习和 Super Res Zoom 来录制视频,将视频增强到 8K,尽管手机无法以该分辨率拍摄。 

Magic Editor 应用程序具有一系列改进的功能,您可以将这些功能应用于自己的照片,例如 Auto Frame,它可以自动重新构图照片,并建议最佳裁剪,或使用生成 AI 扩展您的图像。 

改进的全景功能:Pixel 9 Pro 希望通过改进拍摄过程中的指导和更高分辨率的照片,使全景拍摄效果更好。

4、Pixel 9的AI能力

AI让你笑一笑
图像变清晰
拉近一点距离
去掉照片中不该出现的

SB 1047:加州出台人工智能管理法案 —防范AI灾难还是引发硅谷危机?

销售人员 70% 的时间都花在非销售任务上,AI 可以提供帮助

微软与Palantir强强联合:推进美国国防和情报领域AI

欧洲高校利用AI预测和诊断“阿尔茨海默病”

AI时代,哲学至关重要

OpenAI支持结构化输出和macOS 桌面应用

AI芯片初创公司 Groq 获 6.4 亿美元融资,估值28亿,挑战 Nvidia

微软深度整合Azure AI与GitHub:大幅简化AI应用开发流程

Google推出的Gemma 2 2B模型可以在手机、笔记本电脑和台式机等边缘设备上运行

Grok 的新数据收集设置激怒了 X 用户,可能违反欧盟隐私法规

GPT-4o语音模式灰度测试,同时Long Output支持64K超长输出

市值260亿美元的Canva,收购Leonardo.ai,增强生成式AI的能力

AI的双刃剑:全球治理刻不容缓

大模型价格战,背后的逻辑

OpenAI 推出AI搜索 SearchGPT:挑战谷歌搜索霸主地位

City不City,拥有类人脑的新AI机器人震惊世界!

Meta开源:Llama3.1 405B模型发布

Mem0:增强LLM的记忆功能,实现跨应用的个性化AI体验

OpenAI 发布 GPT-4o Mini:成本优势明显,性能优于 GPT-3.5 Turbo

Agent获客新时代,你的企业上车了吗?

人机共生:大模型时代的工作与生活

传统AI与生成式AI的深度对比

OpenAI的Q计划:“Strawberry"新模型,可自主浏览互联网并自主推理

AI技术与企业数据的深度融合,开辟商业增长新蓝海

未来出行:无人驾驶能否取代网约车司机?

AI Agent:大模型演进的下一站

OpenAI CEO携手Thrive,创办AI健康公司

2024国产AI大模型应用报告

大模型与小模型:AI领域的双轨并行与未来趋势

2024上半年《人工智能现状报告》750名行业领导者、技术人员的意见

三星支持荷兰初创公司Axelera:开发全球最强大的边缘AI芯片

Runway推出GEN3 Alpha模型!

全球首款支持 GPT-4o 的智能眼镜 Solos AirGo Vision 发布

Resona V2A: AI智能解析视频,实现自动配音与配乐

AI文档搜索公司Hebbia融资超1.2亿美元,估值达8亿美元

字节跳动推出“豆包MarsCode”智能编程助手:国内开发者免费使用

每首歌索赔15万美元索尼、环球音乐、华纳起诉 Suno 和 Udio

OpenAI 收购远程协作平台 Multi,在企业解决方案领域发力!

腾讯元宝新版本发布:提升解析能力,支持1000万字超长文处理

RTranslator:全球首个开源实时翻译神器

OpenAI 前首席科学家 Ilya创办新 AI 公司,聚焦超级智能安全

AI Agent进入红海时代,开发者的红利时代来了

2024年美国科技行业裁员潮持续:从巨头到初创企业,60,000名员工面临失业

【AI+考试】30秒出题,1分钟开考,万物皆可考!

GPTZero:人工智能内容检测领域的黑马

PixVerse Magic Brush 上线:7 个示例教你玩转对象移动

LLM推理能力盲区:从《爱丽丝梦游仙境》测试看AI的局限与未来方向

快手发布视频大模型“可灵”:能生成2分钟1080p高质量视频

Qwen2模型家族来了

数名OpenAI、谷歌、DeepMind现任和前任员工,签署公开信警告人工智能风险

SD3 Medium 模型即将开源

AI 服务集体宕机:ChatGPT 领衔,Claude 和 Perplexity 紧随其后

NVIDIA 在 GDC 2024 推出全新数字人技术和 RTX SDK

AI在不同场景下如何提升效率,能否完全取代人类?

我是腾讯元宝,看透繁杂,听懂所需,说享精彩!

OpenAI官宣:已开始训练下一代“前沿AI模型”

马斯克融资60亿美元,计划推出xAI超级计算机

SignLLM:通过文字描述生成手语视频的多语言模型

美国「AI开源大模型」出口管制法案:43 比3通过第一轮

Truecaller:帮你接电话的AI助手来了

使用AI克隆拜登声音,被罚600万美元

大模型价格战升级!阿里、百度、字节跳动争相“降价”,大厂火拼,价格亲民

面壁智能MiniCPM-Llama3-V 2.5实力碾压GPT-4V、Gemini Pro,成为端侧多模态新霸主

FunClip:开源的AI视频自动化视频剪辑工具

国产大模型激战正酣:开源与低价的精彩对决

OpenAl发布GPT-4o全能模型,实时语音和视觉能力,再次刷新业界

探索未来网页设计:Wegic AI对话式建站助手!

月薪8千和月薪3万的区别:有没有熟练使用天工AI!

阿里云发布通义千问2.5:超越GPT-4 Turbo

全国首例“AI外挂”案:游戏世界的黑暗角落

微软为美国情报机构定制 GPT-4 生成式 AI 模型!

Logo Diffusion:打造个性化Logo的AI平台

支付宝智能助理:你生活琐事的“超级管家”

DrEureka:AI让机器狗玩瑜伽球,平衡能力简直绝了!

Copilot Workspace:告别孤独的编码之夜,迎接你的智能副驾

【AI+农业】AI育种大模型“丰登”问世 为粮食安全提供科技支撑

第七代机器人‘凤凰’,接近人类学习速度,24小时内掌握新技能

▲ 滑动查看往期内容

小微模型
一起探索AGI世界,解锁AI实用技能,伴您步入智能生活!
 最新文章