重磅!ChatGPT开启「眼睛」,实时摄像头对话来了!

旅行   2024-11-21 00:01   北京  

ChatGPT终于要「看见」这个世界了!

OpenAI正在为ChatGPT的高级语音模式增加一项重磅新功能——「实时摄像头」,这意味着它很快就能实时看到并理解我们的周围环境了!

这个消息来自最新的ChatGPT v1.2024.317测试版本,代码中已经出现了相关的蛛丝马迹。

一起来看看这个「会看东西的ChatGPT」到底有多厉害!

从「盲人」到「慧眼」

当OpenAI 在 5月份发布GPT-4o时,就展示了一个令人惊叹的演示:

ChatGPT通过实时摄像头,轻松识别出画面中的狗狗,还能记住狗狗的名字。不仅如此,它还能看到玩具球,并自然而然地建议一场抛接游戏!

这完全不是简单的物体识别,而是真正理解了场景和上下文

就像你在和一个超级聪明的朋友视频聊天,他不仅能看到你周围的一切,还能给出恰到好处的互动建议。

实测效果惊艳

一些幸运的用户已经体验到了这个功能的alpha版本。

他们纷纷表示:这简直就像在和一个博学多才的朋友视频通话!

有新手铲屎官在照顾小猫时使用这个功能,ChatGPT能实时观察小猫的状态,给出专业的建议和安慰。这种实时、智能、贴心的互动体验,让AI助手变得前所未有的亲切。

「实时摄像头」揭秘

根据最新泄露的代码,这个功能将被正式命名为「Live camera」。使用方式出人意料的简单:

只需轻点摄像头图标,ChatGPT就能立即「看到」并讨论你的周围环境

不过OpenAI也特别注重安全性,在代码中明确加入了警告提示:

<string name="video_warning">Don't use for live navigation or decisions that may impact your health or safety.</string>

这表明不要依赖这个功能进行实时导航,也不要用它做出可能影响健康和安全的决定

什么时候能用上?

虽然OpenAI还没有公布具体的发布时间表,但从测试版的代码来看,这个功能即将进入beta测试阶段。

业内普遍预测,它很可能会优先向ChatGPT Plus的付费用户开放测试。毕竟这么强大的功能,肯定是要给付费用户一些特权的!

未来已来

这个功能的出现,标志着AI助手正在突破纯文本交互的限制,向着更自然、更智能的方向迈进。

想象一下:当你在DIY时遇到困难,只需打开摄像头,ChatGPT就能看到你的情况,给出精准建议;

当你在超市挑选水果,它能帮你判断成熟度;

当你在整理衣柜,它能给出搭配建议......

这不再是科幻电影,而是即将实现的现实。

不过,如OpenAI的警告所说,这项技术虽然强大,但我们在使用时还是要保持清醒

毕竟,再厉害的AI也不能完全替代人类的判断。

期待这个「长眼睛」的ChatGPT早日和大家见面吧!


👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

  • 每天约监控6000 条消息,可节省约800+ 小时的阅读成本;

  • 每天挖掘出10+ 热门的/新的 github 开源 AI 项目;

  • 每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)

  • 一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;

  • 二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。

欢迎你的加入!

AGI Hunt
关注AGI 的沿途风景!
 最新文章