OpenAI 贺岁短剧第6集:ChatGPT化身圣诞老人,还能视频通话!GPT-4o多模态能力再升级

文摘   2024-12-13 07:52   美国  

 

OpenAI昨日短暂宕机后,迅速修复并推出“12 Days of OpenAI”第6天更新:ChatGPT的Advanced Voice Mode新增视频和屏幕共享功能,实现实时视频通话和屏幕共享限时推出的Santa Mode让用户可以与圣诞老人实时对话。这些更新不仅增强了人机交互体验,更预示着AI在个性化和情感化方向的巨大潜力。

昨日宕机惊魂,OpenAI致歉并承诺发布详细报告

昨天,OpenAI的服务经历了数小时的宕机,全球用户受到影响,无法正常使用ChatGPT等服务。OpenAI迅速响应,在短时间内修复了服务,并公开致歉,承诺将发布详细的事故报告,对此次事件进行彻底的调查和反思。OpenAI表示,他们非常重视服务的稳定性和可靠性,并将采取措施避免类似事件再次发生。尽管这次宕机事件给用户带来了不便,但OpenAI的快速响应和积极态度也展现了其对用户负责的精神。目前网络已经恢复,大家可以正常使用。

不只是语音,ChatGPT现在可以和你“面对面”了!

OpenAI的Advanced Voice Mode一直以其自然流畅的语音交互体验著称,而现在,它又迎来了重大升级—— 引入了视频和屏幕共享功能! 这意味着,你现在不仅可以和ChatGPT进行语音对话,还可以进行实时的视频通话和屏幕共享。这项更新让ChatGPT真正意义上实现了“面对面”的交流,为用户带来了更加直观、生动的交互体验。

这一突破性的功能是基于OpenAI的GPT-4o模型实现的。GPT-4o是一个原生多模态模型,它可以直接处理音频、文本和图像,实现端到端的实时交互。在Advanced Voice Mode中,GPT-4o直接接收用户的音频输入,理解其中的语义和情感,并直接输出音频回应,这使得对话的节奏更加自然,情感表达更加丰富。而现在,视频和屏幕共享功能的加入,进一步拓展了GPT-4o的多模态能力,让ChatGPT能够更好地理解用户的环境和需求,提供更加精准和个性化的服务。 值得一提的是,GPT-4o在视频理解方面表现出色,即使面对遮挡、光照变化等复杂情况,也能准确识别和理解视频内容。

在官方的演示中,我们可以看到,OpenAI的产品负责人Kevin和几位团队成员通过视频与ChatGPT进行了互动。ChatGPT不仅能够识别出每个人的身份,还能记住他们的特征,比如谁戴着驯鹿角,谁戴着圣诞帽。 这种对视觉信息的理解和记忆能力,展现了Advanced Voice Mode强大的多模态融合能力。

除了简单的问答,视频和屏幕共享功能还为Advanced Voice Mode带来了更广泛的应用场景。比如,用户可以通过视频向ChatGPT展示实物,寻求帮助或指导;也可以共享屏幕内容,让ChatGPT更好地理解用户的需求,提供更精准的帮助。

咖啡怎么冲?ChatGPT手把手教你,还能实时纠错!

想学习一项新技能,却苦于没有老师指导?现在,有了Advanced Voice Mode的视频功能,ChatGPT可以化身你的私人教练,手把手教你各种技能,还能实时纠错!

在官方演示中,OpenAI的研究员Rowan就利用视频功能,让ChatGPT教他制作手冲咖啡。Rowan首先展示了他准备好的咖啡器具,包括滤杯、滤纸、咖啡粉和热水壶。然后,他通过视频实时展示了制作手冲咖啡的每一个步骤。

ChatGPT通过视频观察Rowan的操作,并给出了详细的指导,包括如何润湿滤纸、如何加入咖啡粉、如何注水等等。它还解释了“闷蒸”(bloom)的概念,以及如何通过控制注水速度来获得更好的咖啡风味。在Rowan注水的过程中,ChatGPT还实时观察他的手法,并给出了改进建议,比如保持稳定的注水速度,确保咖啡粉均匀湿润。

这个演示生动地展示了Advanced Voice Mode在实时教学方面的强大潜力。通过视频功能,ChatGPT可以观察用户的操作,并给出实时的指导和反馈,这对于学习各种需要动手操作的技能,比如烹饪、手工、乐器等等,都非常有帮助。

想和圣诞老人聊天?OpenAI帮你实现愿望!

除了Advanced Voice Mode的重磅更新,OpenAI还为用户带来了一个充满节日气氛的惊喜——限时推出的Santa Mode!从今天开始到12月底,用户可以直接在ChatGPT中与圣诞老人进行实时对话,体验浓厚的节日氛围。
你可以向圣诞老人提出各种问题,比如他在北极的生活、精灵们的工作、圣诞节的传统等等。圣诞老人会用他标志性的欢快声音回答你的问题,并分享一些有趣的圣诞故事。 在演示中,圣诞老人还展示了他的幽默感,讲了一个关于精灵的笑话:“为什么精灵们喜欢用说唱音乐?因为他们喜欢‘包装’(wrap)礼物!”
Santa Mode的推出,不仅为用户带来了欢乐的节日体验,也展示了OpenAI在AI个性化和情感化方面的探索。圣诞老人不仅仅是一个简单的问答机器人,他拥有独特的个性和声音,能够与用户进行富有情感的互动。 OpenAI通过学习大量圣诞老人声音数据,利用先进的语音合成技术,成功地还原了圣诞老人的标志性声音,让Santa Mode的体验更加逼真有趣。

不止于圣诞老人,AI个性化的未来有多远?

Santa Mode的推出,让我们看到了AI个性化的巨大潜力。它不仅仅是一个节日彩蛋,更是OpenAI对AI人格化的一次重要尝试。通过赋予AI特定的个性和情感,我们可以让AI不再是冷冰冰的工具,而是成为更具亲和力和吸引力的伙伴。

目前,主流观点普遍认为AI是工具,强调其效率和功能性。然而,Santa Mode等产品的出现,正在逐渐改变人们对AI的固有认知。AI不仅可以帮助我们提高效率,还可以成为我们的情感伙伴,为我们提供陪伴和支持。

想象一下,未来我们可以拥有各种具备特定个性和功能的AI伙伴。在教育领域,AI可以化身耐心的老师,根据每个学生的特点进行个性化教学,例如,学而思近期推出的基于大模型的数学教育产品“九歌”;在娱乐领域,AI可以成为我们的游戏伙伴,与我们一起探索虚拟世界,例如,各种AI驱动的NPC角色;在陪伴领域,AI可以成为我们的知心朋友,倾听我们的烦恼,分享我们的快乐,例如,一些公司正在开发的AI陪伴机器人。

“这简直太酷了!”一位网友在体验了Santa Mode后评论道,“我从来没有想过可以和圣诞老人聊天,而且他的声音听起来真的很像!”业界也对OpenAI的这项创新给予了高度评价,认为这是AI技术在情感化和个性化方向的一次重要突破。

当然,目前AI的情感表达还处于初级阶段,要实现真正意义上的情感化和个性化,还需要克服许多技术挑战。但Santa Mode等产品的出现,让我们看到了AI作为情感伙伴的可能性,这将是AI发展的一个重要方向。未来的AI,不仅要有智商,更要有情商,才能真正成为人类的得力助手和亲密伙伴。

新功能上线信息,如何抢先体验?

Advanced Voice Mode的视频和屏幕共享功能将从今天开始,在未来一周内逐步面向Teams用户开放,随后是大多数Plus和Pro订阅用户,欧洲的Plus和Pro订阅用户将尽快获得该功能,企业和教育用户将在明年初获得访问权限。

Santa Mode将在今天全球范围内,所有可以使用ChatGPT语音模式的地区上线。 用户可以在最新的移动应用、桌面应用以及chat.openai.com的桌面网页上使用Santa Mode。在移动应用上,用户可以在主屏幕上寻找一个雪花图标,或者在ChatGPT的设置页面中找到并选择Santa。

为了让用户能够立即体验Santa Mode,OpenAI将对Advanced Voice Mode的使用次数进行一次性重置。 这意味着,即使用户已经用完了当天或当月的Advanced Voice Mode使用次数,也可以立即与圣诞老人进行语音对话。即使在使用次数用完之后,用户仍然可以使用标准语音模式与圣诞老人聊天。

结语

OpenAI的持续创新,不断推动着人机交互技术的边界。从Advanced Voice Mode的语音交互,到现在的视频和屏幕共享,再到Santa Mode的个性化AI,OpenAI正在引领我们走向一个更加智能、更加人性化的未来。

未来,人机交互将不再局限于键盘和鼠标,而是通过语音、视觉等多种模态进行更加自然、直观的交流。AI将不再是冷冰冰的工具,而是成为我们生活中不可或缺的伙伴。让我们一起期待,OpenAI将为我们带来更多惊喜!

相关链接

  • • OpenAI官方博客:https://openai.com/blog
  • • ChatGPT官网:https://chat.openai.com

子非AI
子非AI,亦解AI之妙:一站式AI情报站,助你开启智能未来之门。
 最新文章