OpenAI昨日短暂宕机后,迅速修复并推出“12 Days of OpenAI”第6天更新:ChatGPT的Advanced Voice Mode新增视频和屏幕共享功能,实现实时视频通话和屏幕共享;限时推出的Santa Mode让用户可以与圣诞老人实时对话。这些更新不仅增强了人机交互体验,更预示着AI在个性化和情感化方向的巨大潜力。
昨日宕机惊魂,OpenAI致歉并承诺发布详细报告
昨天,OpenAI的服务经历了数小时的宕机,全球用户受到影响,无法正常使用ChatGPT等服务。OpenAI迅速响应,在短时间内修复了服务,并公开致歉,承诺将发布详细的事故报告,对此次事件进行彻底的调查和反思。OpenAI表示,他们非常重视服务的稳定性和可靠性,并将采取措施避免类似事件再次发生。尽管这次宕机事件给用户带来了不便,但OpenAI的快速响应和积极态度也展现了其对用户负责的精神。目前网络已经恢复,大家可以正常使用。
不只是语音,ChatGPT现在可以和你“面对面”了!
这一突破性的功能是基于OpenAI的GPT-4o模型实现的。GPT-4o是一个原生多模态模型,它可以直接处理音频、文本和图像,实现端到端的实时交互。在Advanced Voice Mode中,GPT-4o直接接收用户的音频输入,理解其中的语义和情感,并直接输出音频回应,这使得对话的节奏更加自然,情感表达更加丰富。而现在,视频和屏幕共享功能的加入,进一步拓展了GPT-4o的多模态能力,让ChatGPT能够更好地理解用户的环境和需求,提供更加精准和个性化的服务。 值得一提的是,GPT-4o在视频理解方面表现出色,即使面对遮挡、光照变化等复杂情况,也能准确识别和理解视频内容。
在官方的演示中,我们可以看到,OpenAI的产品负责人Kevin和几位团队成员通过视频与ChatGPT进行了互动。ChatGPT不仅能够识别出每个人的身份,还能记住他们的特征,比如谁戴着驯鹿角,谁戴着圣诞帽。 这种对视觉信息的理解和记忆能力,展现了Advanced Voice Mode强大的多模态融合能力。
除了简单的问答,视频和屏幕共享功能还为Advanced Voice Mode带来了更广泛的应用场景。比如,用户可以通过视频向ChatGPT展示实物,寻求帮助或指导;也可以共享屏幕内容,让ChatGPT更好地理解用户的需求,提供更精准的帮助。
咖啡怎么冲?ChatGPT手把手教你,还能实时纠错!
在官方演示中,OpenAI的研究员Rowan就利用视频功能,让ChatGPT教他制作手冲咖啡。Rowan首先展示了他准备好的咖啡器具,包括滤杯、滤纸、咖啡粉和热水壶。然后,他通过视频实时展示了制作手冲咖啡的每一个步骤。
ChatGPT通过视频观察Rowan的操作,并给出了详细的指导,包括如何润湿滤纸、如何加入咖啡粉、如何注水等等。它还解释了“闷蒸”(bloom)的概念,以及如何通过控制注水速度来获得更好的咖啡风味。在Rowan注水的过程中,ChatGPT还实时观察他的手法,并给出了改进建议,比如保持稳定的注水速度,确保咖啡粉均匀湿润。
这个演示生动地展示了Advanced Voice Mode在实时教学方面的强大潜力。通过视频功能,ChatGPT可以观察用户的操作,并给出实时的指导和反馈,这对于学习各种需要动手操作的技能,比如烹饪、手工、乐器等等,都非常有帮助。
想和圣诞老人聊天?OpenAI帮你实现愿望!
不止于圣诞老人,AI个性化的未来有多远?
目前,主流观点普遍认为AI是工具,强调其效率和功能性。然而,Santa Mode等产品的出现,正在逐渐改变人们对AI的固有认知。AI不仅可以帮助我们提高效率,还可以成为我们的情感伙伴,为我们提供陪伴和支持。
想象一下,未来我们可以拥有各种具备特定个性和功能的AI伙伴。在教育领域,AI可以化身耐心的老师,根据每个学生的特点进行个性化教学,例如,学而思近期推出的基于大模型的数学教育产品“九歌”;在娱乐领域,AI可以成为我们的游戏伙伴,与我们一起探索虚拟世界,例如,各种AI驱动的NPC角色;在陪伴领域,AI可以成为我们的知心朋友,倾听我们的烦恼,分享我们的快乐,例如,一些公司正在开发的AI陪伴机器人。
“这简直太酷了!”一位网友在体验了Santa Mode后评论道,“我从来没有想过可以和圣诞老人聊天,而且他的声音听起来真的很像!”业界也对OpenAI的这项创新给予了高度评价,认为这是AI技术在情感化和个性化方向的一次重要突破。
当然,目前AI的情感表达还处于初级阶段,要实现真正意义上的情感化和个性化,还需要克服许多技术挑战。但Santa Mode等产品的出现,让我们看到了AI作为情感伙伴的可能性,这将是AI发展的一个重要方向。未来的AI,不仅要有智商,更要有情商,才能真正成为人类的得力助手和亲密伙伴。
新功能上线信息,如何抢先体验?
Advanced Voice Mode的视频和屏幕共享功能将从今天开始,在未来一周内逐步面向Teams用户开放,随后是大多数Plus和Pro订阅用户,欧洲的Plus和Pro订阅用户将尽快获得该功能,企业和教育用户将在明年初获得访问权限。
Santa Mode将在今天全球范围内,所有可以使用ChatGPT语音模式的地区上线。 用户可以在最新的移动应用、桌面应用以及chat.openai.com的桌面网页上使用Santa Mode。在移动应用上,用户可以在主屏幕上寻找一个雪花图标,或者在ChatGPT的设置页面中找到并选择Santa。
为了让用户能够立即体验Santa Mode,OpenAI将对Advanced Voice Mode的使用次数进行一次性重置。 这意味着,即使用户已经用完了当天或当月的Advanced Voice Mode使用次数,也可以立即与圣诞老人进行语音对话。即使在使用次数用完之后,用户仍然可以使用标准语音模式与圣诞老人聊天。
结语
OpenAI的持续创新,不断推动着人机交互技术的边界。从Advanced Voice Mode的语音交互,到现在的视频和屏幕共享,再到Santa Mode的个性化AI,OpenAI正在引领我们走向一个更加智能、更加人性化的未来。
未来,人机交互将不再局限于键盘和鼠标,而是通过语音、视觉等多种模态进行更加自然、直观的交流。AI将不再是冷冰冰的工具,而是成为我们生活中不可或缺的伙伴。让我们一起期待,OpenAI将为我们带来更多惊喜!
相关链接
• OpenAI官方博客:https://openai.com/blog • ChatGPT官网:https://chat.openai.com