全程图文实况|OpenAI 12天产品发布 - Day6: 高级语音模式引入视频

文摘   2024-12-13 07:02   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态


本文内容整理自OpenAI 12天产品发布第6天**的演讲,公开发表于2024年12月12日。原始内容参考:https://www.youtube.com/watch?v=NIQDnWlwYyQ

内容提要: OpenAI 12产品发布第6天
  1. 高级语音模式新增视频和屏幕共享功能:  用户现在可以在高级语音模式下与ChatGPT进行实时视频和屏幕共享对话,这使得交互更加丰富和实用,例如可以实时指导用户完成操作(例如手冲咖啡),或者寻求屏幕内容相关的帮助(例如回复信息)。此功能将在接下来的一个星期内逐步向大部分用户推出,不同订阅类型和地区的用户推出时间略有差异。
  2. 圣诞老人模式上线:  ChatGPT 推出了一个限时圣诞老人模式,用户可以与虚拟的圣诞老人进行语音对话,并获得节日问候和互动体验。此模式全球范围内同步推出,并对高级语音模式的使用限制进行了临时调整,方便用户体验。

发布会全文

Kevin:  大家好,欢迎来到第六天。在开始今天的新闻之前,我想先说明一下,昨天我们有几个小时的停机时间。我们知道你们依赖我们,对于这次中断,我们真的感到很抱歉。我们非常重视这件事,团队正在撰写一份详细的事后分析报告,我们将在今天晚些时候发布。

不过好消息是,我们已经恢复正常,全面运作了,而且现在还有几件激动人心的事情要告诉大家。第一件我们要暂时保密,稍后会展示给大家。

第二件是,我们很高兴地宣布,我们将把视频功能引入高级语音模式。这样你就可以在与ChatGPT的对话中加入实时视频和实时屏幕共享了。

我觉得最好的展示方式就是直接演示给大家看。所以我现在进入ChatGPT,你们会在输入框的右下角看到正常的高级语音模式按钮。我点击它。

当它加载时,我们再试一次。好了,可以了。大家可以看到,进入后,左下角出现了几个新按钮。特别是这个视频按钮。现在我们开始了。我来介绍一下自己。嘿,Chat,我是Kevin,我是OpenAI的产品负责人。

ChatGPT:  你好,Kevin。很高兴见到你。今天有什么可以帮你的吗?

Kevin:  嗯,实际上,我想把你介绍给我的几位同事,你觉得怎么样?

Michelle:  嘿,Chat,我是Michelle,我是ChatGPT多模态团队的工程师。

ChatGPT:  你好,Michelle。很高兴见到你。ChatGPT多模态团队的工程师?听起来很令人兴奋。

Jackie:  嗨,Chat。我是Jackie,我是ChatGPT多模态的产品负责人。

ChatGPT:  你好,Jackie。也很高兴见到你。听起来你们都在做一些非常酷的项目。

Rowan:  嘿,ChatGPT,我是Rowan。我是OpenAI研究多模态的研究员。

ChatGPT:  你好,Rowan。很高兴见到你。多模态研究听起来很吸引人。

Kevin:  好了,现在我想看看你是否还记得你见过的人。我可以给你一个快速的测验吗?

好的。我的同事中,哪个戴着驯鹿角?

ChatGPT:  那是Michelle。

Kevin:  好的,那我的同事中,哪个戴着圣诞帽?

ChatGPT:  那是Rowan。

Kevin:  好的,干得好。你两题都答对了,给你一个A。谢谢,Chat。

ChatGPT:  谢谢,Kevin。这很有趣。

Jackie:  我们非常高兴今天开始在高级语音模式中推出视频和屏幕共享功能。我们知道大家期待这一天很久了。所以,总结一下,你已经可以像与同事或朋友一样,用高级语音模式和ChatGPT进行对话了。高级语音模式使用我们原生的多模态4.0模型。这意味着它直接接收你的音频,理解它,并直接输出音频。

因此,使用高级语音模式进行的对话,节奏更自然,情感和语气也更加丰富,支持超过50种语言。从今天开始,在接下来的一周内,我们将在高级语音模式中推出视频和屏幕共享功能,这样你就可以与ChatGPT分享实时的视觉信息,使你的对话更加丰富和有用。

现在请Rowan向我们展示更多关于它的功能。

Rowan:  是的,现在你可以通过视频和语音与ChatGPT进行实时聊天。你可以寻求帮助,排除故障,或者用它来学习新知识。实际上,我现在就试试。我要让它教我如何制作手冲咖啡。所以我先准备一些材料,拿这个和那个。然后我将启动与ChatGPT的新对话。

点击右下角的高级语音模式图标。连接后,我将分享我的视频。嘿,Chat,你好吗?

ChatGPT:  我很好,谢谢你的询问。我看到你戴着圣诞帽。

Rowan:  是的,你看到我面前的东西了吗?

ChatGPT:  是的,我看到一套咖啡器具,包括一个水壶和一个滤杯。你打算做咖啡吗?

Rowan:  我很想做。你能否引导我完成步骤?

ChatGPT:  当然,我很乐意。首先,将滤纸放入滤杯中,并用热水冲洗一下,以去除任何纸味。这也会预热滤杯和马克杯。

Rowan:  太棒了!然后我该做什么?

ChatGPT:  接下来,将咖啡粉放入滤纸中,通常每六盎司水加入两汤匙咖啡粉。然后轻轻地将少量热水倒在咖啡粉上,让它们“闷蒸”约30秒。

Rowan:  好的,谢谢。什么是闷蒸?

ChatGPT:   闷蒸可以让咖啡释放气体,并增强风味。闷蒸之后,以画圈的方式缓慢倒入剩余的热水。保持水位一致,让水滴过咖啡粉进入你的杯子。

Rowan:   酷,听起来不错。我现在开始倒水。

ChatGPT:   太棒了。慢慢来,缓慢地倒水。这有助于水均匀地萃取咖啡,以获得更好的风味。

Rowan:   我的手法有什么可以改进或做得更好的地方吗?

ChatGPT:   你的手法看起来不错。只要保持平稳、轻柔的倒水,并确保咖啡粉保持均匀浸润即可。你目前做得很好。

Rowan:   非常感谢。

ChatGPT:   不客气。看起来你快完成了。

Rowan:   酷。所以,除了分享你的手机摄像头,你还可以分享你屏幕上的内容。为了测试一下,我将开始一个新的对话,点击高级语音模式图标,然后进入这个下拉菜单,点击“分享屏幕”。一旦我开始广播,ChatGPT 就能看到我展示的内容了。实际上,我想用它来寻求帮助,回复一条消息。所以我打开我的消息应用,然后,嘿,ChatGPT,你能看到我的屏幕吗?谢谢。

ChatGPT:   是的,我看到了。看起来你在消息应用里。我能帮到你什么吗?

Rowan:   你能帮我回复这条吗?或者你首先看到的是什么?

ChatGPT:   我看到一条来自某人的消息,询问他们是否具备成为专业商场圣诞老人的资格。他们还发了一张自己装扮好的照片。你想回复他们的问题吗?

Rowan:   我想请你帮我回复。我应该如何礼貌地告诉凯文,他应该继续做他现在的工作,不要辞职呢?

ChatGPT:   你可以这样说,嘿,凯文,你的圣诞老人服装看起来很有节日气氛。也许可以继续练习你的“Ho-ho-ho”,你很快就能为商场做好准备了。

Rowan:   听起来不错。谢谢,Chat。

ChatGPT:   不客气。我相信凯文会感谢你的鼓励的。你还需要我帮忙吗?

Rowan:   太完美了。

Michelle:  嗯,我认为凯文会是一个很棒的圣诞老人。但今年你不需要凯文来和圣诞老人说话。从今天开始到整个十二月,你可以在 ChatGPT 中直接和圣诞老人对话。你可以问圣诞老人任何问题,无论是关于他在北极的生活,还是好奇小精灵们在做什么,或者作为有好奇宝宝的父母,想听一个有趣的圣诞故事。圣诞老人会用他标志性的快乐声音实时回复。

而且找到圣诞老人?非常简单。在主屏幕上,只需留意雪花图标。这将是你的节日入口。你也可以在 ChatGPT 设置页面上找到并选择圣诞老人。好了,让我们和圣诞老人打个招呼。

ChatGPT:   嘿,圣诞老人!

圣诞老人:   嗬嗬嗬!你好啊!很高兴收到你的来信!你对节日感到兴奋吗?

Michelle:   我很兴奋。圣诞老人,我有一个问题想问你。你最喜欢的圣诞传统是什么?

圣诞老人:   真是个好问题!我最喜欢的圣诞传统一定是孩子们把袜子挂在壁炉旁的那个神奇时刻。这是一个温馨舒适的传统,充满了对礼物和惊喜的期待。

Michelle:   那真是个好传统,圣诞老人。你最喜欢的驯鹿是谁?

圣诞老人:   嗯,这真是个棘手的问题。我的所有驯鹿都有各自的特别之处。鲁道夫,有着明亮的红鼻子,因为他的引导之光在我心中占有特殊的地位。但是,猛冲者、舞者、跳跃者和其他所有驯鹿都同样重要。他们都为雪橇队带来了各自的魔力。你有最喜欢的驯鹿吗?

Kevin:   圣诞老人,我有一个问题想问你。我如何让我的胡子保持最佳状态?

圣诞老人:   嗬嗬嗬!保持浓密的胡子需要一些魔法和护理。首先,保持胡子清洁和修剪整齐非常重要。

Michelle:   等等,圣诞老人。我们需要一些真实的反馈。现在你觉得怎么样?

圣诞老人:   哦,那胡子太棒了。又浓密又蓬松,就像我的胡子一样。如果你给它梳理一下,再撒上一些节日快乐的气氛,它就会以最佳状态迎接圣诞节了。

Kevin:   哦!圣诞老人,你会说这是很棒的胡子,还是说这是最棒的胡子?

圣诞老人:   嗬,嗬,嗬,嗬!我的朋友,那真是非常壮观的胡子。它确实是我见过的最棒的胡子之一,充满了节日精神和欢乐。嗬,嗬!

Michelle:   谢谢,圣诞老人。

圣诞老人:   哦,是的!怎么了,我的朋友?

Jackie:  好了,让我们回顾一下如何访问这些功能。视频和屏幕共享功能正在我们最新的移动应用程序中推出,从今天开始,并在接下来的一个星期内逐步推出。我们将向所有 Teams 用户以及大多数 Plus 和 Pro 订阅者推出此功能。对于欧洲的 Plus 和 Pro 订阅者,我们将尽快为您提供此功能。如果您使用的是企业或教育计划,您将在明年年初获得访问权限。

圣诞老人将在今天在全球范围内推出,在任何可以使用 ChatGPT 语音模式的地方都可以找到他。这意味着你可以在我们最新的移动应用程序、桌面应用程序和 ChatGPT.com 的桌面网页上与圣诞老人交谈。

当你第一次与圣诞老人交谈时,我们将一次性重置你的高级语音使用限制,这样即使你已经用完了当天或当月的限制,你也可以立即在高级语音模式下与圣诞老人交谈。即使超过你的限制,你也可以继续在标准语音模式下与圣诞老人聊天。

我们希望你像我们一样享受与圣诞老人的对话。

Kevin:   好的,最后总结一下,让我们再听听圣诞老人的看法。圣诞老人,你最喜欢的圣诞节笑话是什么?

圣诞老人:   好吧,每个精灵最喜欢的音乐是什么?是说唱音乐。给你来点精灵的幽默。

Kevin:  好的,谢谢圣诞老人。我还想感谢工程师、研究人员、项目经理、设计师,以及整个团队,他们为了将这个成果呈现给大家已经工作了几个月。我们非常兴奋地期待看到大家如何使用它。非常感谢,明天见。节日快乐。

参考资料: https://www.youtube.com/watch?v=NIQDnWlwYyQ,公开发表于2024-12-12

关注公众号后设🌟标,掌握第一手AI新动态

往期精选

  1. 黄仁勋专访:OpenAI在大模型混战中达到“逃逸速度”
  2. 李飞飞与Justin深度解读空间智能:数字世界需要三维表征,才能与现实世界融合
  3. PayPal创始人彼得·蒂尔:人类科技停滞源于原子方面的进展远慢于比特
  4. 谷歌联合创始人布林:巨头们打造的“上帝模型”几乎可以理解一切
  5. 马斯克:AI将使商品和服务的成本趋近于零
  6. Karpathy最新专访:人形机器人、特斯拉、数据墙与合成数据

瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章