ChatGPT语音模式将迎来重大升级!
OpenAI正在为ChatGPT的高级语音模式开发一项重磅新功能——屏幕和摄像头共享。
这一消息由应用研究员Nima Owji率先曝光,引发广泛关注。
屏幕共享:ChatGPT的新武器
据Nima Owji透露,OpenAI正在努力让用户能够通过网页应用与ChatGPT的高级语音模式共享PC屏幕或摄像头。
这意味着,未来我们可能可以直接向ChatGPT展示我们的工作界面,让AI助手更直观地了解我们的需求。
想象一下,当你在使用图形设计软件时遇到问题,你可以直接向ChatGPT展示你的屏幕,让它看到你的工作环境、工具栏、调色板等,然后给出更精准的建议。
这将大大提升ChatGPT的实用性和交互体验。
语音模式的惊喜升级
对于这个即将到来的新功能,Teknium表示了极大的兴奋:
「这正是我对语音模式公告最期待的部分,我原以为它们是一个整体包装——但后来语音功能单独发布了。我非常期待它(屏幕共享)能(希望)在某一天到来。」
Teknium的评论揭示了一个有趣的细节:屏幕共享功能原本可能是与语音模式一起推出的。
这让我们不禁猜测,OpenAI是否正在为ChatGPT准备一次重大升级?
技术挑战与期待
然而,将屏幕共享功能整合到ChatGPT中并非易事。
开发者Paul Calcraft指出的:
「最初以为我们只是在等待他们构建应用/网页应用,我今天还打算做一个原型,但刚刚发现实时API目前只支持文本和音频。真遗憾。」
这表明,实现屏幕共享功能可能需要对ChatGPT的底层API进行重大改进。目前的实时API限制可能是阻碍这一功能快速推出的主要原因。
尽管如此,OpenAI在这个方向上的努力仍然值得期待。
屏幕共享功能的加入将使ChatGPT更接近一个全方位的智能助手,能够理解视觉输入,提供更精准、更有针对性的帮助。
未来展望
随着屏幕共享功能的开发,我们可以期待ChatGPT在以下领域发挥更大作用:
远程技术支持:IT支持人员可以直接查看用户的屏幕,提供更精准的指导。
设计协作:设计师可以实时展示作品,获得AI的即时反馈。
教育辅导:教师可以直观地向AI展示教学材料,获得教学建议。
软件使用指导:用户可以在使用复杂软件时获得更直观的AI辅助。
屏幕共享功能的加入,将极大地拓展ChatGPT的应用场景,使其成为一个更加强大、灵活的AI助手。
期待OpenAI尽快克服技术障碍,尽快带来这一激动人心的新功能。
毕竟,好饭也怕晚。
再晚了等别人都开源了,就没什么可激动了。
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!