OpenAI新王炸:ChatGPT可以“看”人说话 实时视频对话

科技   2024-12-13 20:18   上海  

数智世界风起云涌,互联网新旧迭代,AIGC蓬勃而出。前瞻钱瞻联合m360推出每日科技互联网前瞻,从更全面的视野、更广阔的视域,洞察行业跌宕起伏,在趋势前瞻中把握市场脉动,引领敏捷增长风向标!

今日核心看点:

1、剪映CapCut2024年收入近百亿元

2、华为余承东进军抖音 一夜涨粉43万

3、李斌称华为小米进场对行业改变很大 蔚来品牌不会参与价格战

4、特朗普第二次当选《时代》周刊年度人物
5、谷歌再战增强现实 推出全新操作系统Android XR
6、OpenAI新王炸:ChatGPT语音助手可以“看”人说话了 能实时视频对话


剪映CapCut2024年收入近百亿元

字节跳动旗下创作工具剪映和CapCut,在2024年实现了超过三位数收入增长,总收入正接近百亿元人民币。同时,剪映和CapCut的全球月活用户,也已经超过8亿

2024年初,抖音集团前CEO张楠调任到剪映部门,负责剪映和CapCut的相关业务。张楠当时在内部信中表示,非常看好AI给创作工具带来的机会和前景。今年5月,剪映推出了AI创作工具即梦。随后,字节在文生图、图生视频等方向推出的新模型,大多都第一时间在即梦落地。

华为余承东进军抖音

一夜涨粉43万

“双十二”当晚,余承东低调地开通了抖音官方账号,认证信息为“华为常务董事、终端BG&智能汽车解决方案BU董事长”,签名为“Make lt Possible 以行践言”。即便未发一条视频却激起千层浪,余承东零帧起手涨粉43万,同时登上抖音热搜榜一。

今年主导华为“四界”造车军团、两大旗舰手机的余承东十分忙碌。他频繁现身各大活动,似乎在努力习惯“网红企业家”的新身份。

作为科技圈的顶流,余承东朴实又敢言的性格在网络平台吸粉无数。不过很长一段时间,他的个人IP多建立于网友自发的民间传播中。直到如今亲自下场,余承东开启了流量时代的主动进击。

在半年前的粤港澳大湾区车展上,余承东曾表示,“现在就是流量经济时代,从带货、卖货角度看直播确实非常有意义。”但他一直存有顾虑,“好几年前内部就跟我提要搞,但华为是一个比较严谨的公司,我觉得太高调了,一直没答应”。

他的态度逆转,发生在一个月前。11月下旬,余承东入驻微信视频号,为Mate品牌盛典预热,对旗舰MATE 70、智界S7的“官方剧透”开始批量产出,余承东个人台前幕后的小故事和高光片段也随之上线。截至12月13日,余承东一共发布了15个视频,近期的视频主要涉及“智界”汽车,介绍了该车的空间、配置等情况。

李斌称华为小米进场对行业改变很大

蔚来品牌不会参与价格战

在蔚来面对面活动上,蔚来创始人、董事长、CEO 李斌公布了他们最近的一些进展。对于乐道的产能问题,他表示乐道L60这个月的交付量肯定能到1万台,他们的计划是在2025年3月实现每月交付2万辆乐道汽车。

他还提到,蔚来品牌不会参与价格战,要保持价格稳定。保持销量只能下苦功夫。他认为,公司的增长比原计划慢了两年,主要是由于执行不力。因此,蔚来将进一步提高效率,控制成本。此外,他表示蔚来的公司战略方向清晰,很多问题是执行的问题。“公司不会去做折返跑,这不是我们做事的方式,不会有大家期待的非常drama的调整。”

李斌称,电动汽车行业竞争激烈,再过两三年能不能留在牌桌上就见分晓了。“行业处于更高维度的竞争中,这不简单的是产品、技术和服务的竞争,而是多维度、全面的竞争,不能有短板。华为、小米等科技公司进场,对行业改变很大,传统汽车公司在进行大投入,新创业公司也在全面构建能力。”

他表示,今年汽车同行做得很不错,虽然卷得很厉害。相信明年和今年比还是会有增长,但市场竞争会比较惨烈,因为新进入者要站稳脚就要有攻击性,而传统公司要保持市场份额难免要通过降低价格守住市场。

特朗普第二次当选

《时代》周刊年度人物

《时代》周刊将 2024 年度人物颁给了即将再次入主白宫的唐纳德·特朗普,以表彰他令人惊叹的政治复出以及他经历暗杀企图和重罪定罪的历史性一年。

该杂志写道:「由于特朗普实现了历史性的回归,推动了百年不遇的政治重塑,他被评为《时代》2024 年度人物。」

这一结果也印证了普遍的预期。自 2000 年布什以来,该杂志在每届总统大选中都将这一荣誉授予获胜者。特朗普在 2016 年首次赢得美国大选时也被评为该杂志的年度人物。

谷歌再战增强现实

推出全新操作系统Android XR

谷歌宣布推出全新操作系统 Android XR,「XR」代表「扩展现实」,包括虚拟现实、增强现实和混合现实等多种技术。

Android XR 可被视作苹果 visionOS 的「有力竞争对手」。谷歌计划将多款应用带入该系统中,官方表示,通过头戴显示器,用户可以随时在虚拟世界和现实世界之间自如切换,享受全新的沉浸式体验。

Android XR 的发布视频中并未透露太多细节,仅展示了头戴设备的渲染图和「概念化设计」示例。据谷歌介绍,XR 平台将支持 Gemini、Google Maps、Google 相册、翻译、Chrome、圈选即搜等应用,同时也为现有 Android 应用提供支持。

OpenAI新王炸:
ChatGPT语音助手可以“看”人说话了

能实时视频对话

OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,包括视频对话和实时屏幕共享,以及一个增添节日趣味的“圣诞老人”音色。

美东时间12月12日,OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能。Advanced Voice由OpenAI的多模态模型GPT-4o支持。

视频功能启动方式很简单,点击对话框右下角的高级语音模式图标,加载完成后点击新增的“视频”按钮即可开始。OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”(Share Screen)。

在和ChatGPT的视频对话中,OpenAI研究员提问,研究员先让GPT看到并和现场的OpenAI工作人员分别打过招呼,然后问GPT,现场谁的打扮最像圣诞老人,谁像圣诞老人的驯鹿,GPT均作出准确而回答。研究员演示了,给GPT转发一个短信内容及图片,让GPT建议如何回复对方的短信。

研究员还演示了,利用Advanced Voice的新功能让GPT帮忙校对或者通过GPT学习新东西。比如找出一些制作手冲咖啡的咖啡壶、过滤杯等工具,向GPT展示并询问如何使用这些工具,在操作时,让GPT评价做得如何,并给出建议。

再来是屏幕共享功能。只需要把自己的屏幕内容实时分享给 ChatGPT ,向它寻求帮助。点击高级语音模式图标后,从下拉菜单中选择“共享屏幕”选项即可。Rowan继续与ChatGPT分享了消息应用中的对话内容,请它帮忙编辑一条幽默礼貌的回复。

视频对话是OpenAI今年5月首次演示高级语音模式后,就被用户敲碗的新功能,如今总算兑现。能想到的使用场景有技能学习,比如烹饪、手工制作、运动技巧,也可用于日常生活种答疑和景点、产品介绍等。

屏幕共享则支持用户分享各种文档内容,获取优化建议,或是实时展示手机设备和软件问题,让ChatGPT提供实际解决方案。添加新交互方式后的语音模式,一定程度上也提升了对话的直观性和实用性。


点击阅读原文(http://wap.media360.vip/vip)
欢迎成为m360会员!
m360是每一位用户的超级连接器、前瞻中心及智库。
为您所面临的市场竞争和增长需求,提供整套支持系统。


媒介三六零
m360:科技x商业x媒介 咨询智库平台,致力于推动元宇宙WEB3.0时代,数智互联、商业艺术及媒体创新的融合增长,为行业提供科技、商业、文化、营销趋势风向标,用战略趋势前瞻与分析罗盘,以专业促前进。
 最新文章