AI创业者
三星的财报透露:联手谷歌的AI+XR设备将于2025年问世;奥特曼透露ChatGPT等未来产品计划,并且首度回应Ilya到底看到了什么:答案是“超越的未来”;OpenAI的首席产品官暗示2025年将出现AI自主代理。
谷歌、三星、高通联手的XR设备将于2025年上市
近期三星财务报告中的一张幻灯片透露新的基于AI的MR设备将在2025年亮相。高通首席CEO对此次合作开发的混合现实智能眼镜特别兴奋,而谷歌正在为Play Store做好准备,迎接即将到来的一切。(刚刚,高通CEO称正与三星和谷歌合作开发MR+AI眼镜,与苹果不同路线)
谷歌是否会在与高通、三星等公司达成的神秘AR/VR合作后,展示新的产品?或者,谷歌是否会回应Meta的请求,最终将其Google Play商店引入Meta的Quest平台?无论如何,根据Android Authority在应用商店代码中发现的细节,谷歌似乎正为头戴设备在Play商店中进行准备。
该截图显示,Play商店的“安装到更多设备”菜单中出现了一个头戴设备的小图标,而其他应用列表的描述中也提到了“XR头戴设备”。
这些迹象并不意味着谷歌将重新推出自己的头戴设备,此前谷歌大幅缩减了其AR/VR部门,但它依然在这个领域有所动作。包括其正在构建的“Micro XR”平台,计划授权给头戴设备制造商使用,与三星合作开发的混合现实智能眼镜。同时,谷歌今年早些时候在I/O大会上也短暂展示了一款尚未发布的AR眼镜原型(Meta的AR/VR部门收入连续第三个季度高于去年;谷歌AI眼镜背后的AI多模态Astra最早2025年发布)
另一方面,谷歌可能改变了关于在Meta Quest头戴设备上推出Play商店的态度。今年早些时候,Meta曾向谷歌提出请求,希望让Quest用户下载常规安卓应用,但被谷歌拒绝。自那之后,Meta宣布将在其自家应用商店中提供2D应用,而非依赖谷歌的Play商店。
奥特曼称OpenAI计算能力不足正拖延公司产品发布
在Reddit上的一次AMA活动中,OpenAI CEO奥特曼承认,计算能力的缺乏是阻碍公司按预期频率发布产品的主要原因之一。
在回答关于为什么OpenAI的下一代AI模型延迟的问题时,Altman表示:“所有这些模型都变得相当复杂。”他补充道,“我们还面临很多限制,并且必须在如何分配计算资源以支持许多出色的想法上做出艰难的决定。”
多方报道表明,OpenAI在为运行和训练其生成模型所需的计算基础设施上遇到困难。就在本周,路透社援引消息称,OpenAI已与Broadcom合作数月,以开发一款用于运行模型的AI芯片,预计最早在2026年发布。
部分因为计算资源紧张,Altman表示,OpenAI的ChatGPT高级语音模式(Advanced Voice Mode)的拟真对话功能,短期内不会得到最初在四月演示时展示的视觉功能支持。在四月的发布会上,OpenAI展示了ChatGPT应用在智能手机上运行,能响应摄像头视野内的视觉提示,例如识别他人穿着的衣服。
Fortune的报道后来揭露,这次演示是匆忙安排的,目的是抢在同周举办的Google I/O开发者大会之前引起关注。OpenAI内部很多人认为GPT-4o尚未准备好展示——说明问题的是,高级语音模式的纯语音版本也推迟了数月才推出。
在AMA中,Altman还提到OpenAI的下一代图像生成器DALL-E尚无发布时间表。他表示,“我们还没有具体的发布时间计划。”与此同时,OpenAI的视频生成工具Sora也因“需要完善模型,解决安全性/模仿/其他问题并扩展计算能力”而被推迟。OpenAI首席产品官Kevin Weil也在AMA中透露了这一点。
据The Information报道,Sora因技术障碍落后于Luma和Runway等竞争对手。最早在二月展示的原始系统需要超过10分钟的处理时间才能生成1分钟的视频片段。
十月,Sora的联合负责人之一Tim Brooks离职并加入了Google。
在AMA的后续问答中,Altman表示,OpenAI正在考虑“未来某天”允许ChatGPT包含“NSFW”内容,他写道,“我们完全相信应该将成年人当作成年人来对待。”他还强调,公司目前的首要任务是提升其“o1”系列“推理”模型及其后续产品。OpenAI在本周于伦敦举办的DevDay大会上预览了即将为o1推出的一些功能,包括图像理解功能。
Altman写道:“今年晚些时候我们将发布一些非常不错的更新,不过不会称之为GPT-5。”
AI创业者
【汇总】奥特曼关于最新ChatGPT产品规划以及AGI商业化观点:
AI+数字人创业者内容汇总:
数字人
创业者
AI数字人顶流D-ID推出可进行实时对话的新高质量虚拟形象
AI视频平台D-ID今日宣布推出两种新类型的虚拟形象——Express和Premium+,专为内容创作而设计。
各家公司正追求打造更逼真的AI虚拟形象,这些虚拟形象有望在营销、销售和客户支持等企业应用领域承担视频制作任务。借助不同的生成模型,只需少量文字输入和视觉数据,即可创建适用于商业用途的、自然逼真的视频。D-ID推出的新模型正是为了增强在这一领域的竞争力。
Express虚拟形象只需大约一分钟的视频即可训练,能够在讲话时模仿用户的头部动作。而Premium+则是公司的旗舰模型,可能需要至少几分钟的录制训练,但可以在视频中再现具有手部和躯干动作的AI虚拟形象。公司认为,通过添加手部和躯干动作,虚拟形象在与用户互动时显得更加人性化。
公司表示,Premium+模型具备实时互动能力,适用于研讨会和翻译等应用场景。
D-ID计划将这些虚拟形象应用于企业场景中,例如生成销售线索、客户互动以及个性化的营销活动。
D-ID的CEO Gil Perry表示:“我们相信与AI模型的最佳互动方式是面对面,这也是我们创建这些高度逼真的虚拟形象和自然用户界面的原因。”
“我们也认为商业人士会创建自己的数字虚拟形象。我们希望这些虚拟形象安全可靠,不会被用来误导他人。”
D-ID表示,个性化视频营销活动的效果更好,点击率提升了30%,转化率提升了35%。
除了新虚拟形象,D-ID还推出了企业营销套件,提供互动虚拟形象和品牌AI代言人、视频活动生成、30种语言的翻译支持,并可集成Canva和PowerPoint等平台,以及与CRM和营销自动化工具的API集成。
参考:
https://techcrunch.com/2024/10/31/d-id-launches-new-high-quality-avatars-capable-of-real-time-conversations/
https://techcrunch.com/2024/10/31/openai-ceo-sam-altman-says-lack-of-compute-is-delaying-the-companys-products/
https://www.theverge.com/2024/10/30/24283894/google-play-store-ar-vr-xr-headset-smart-glasses-support-code-leak
—— End ——
扫码订阅媒体VIP:【驶向互联网下一站】是三次方旗下、基于付费订阅的一个创业者内容社区,我们关注科技与商业,重点赋能AI、XR、元宇宙、一人公司方向的创业者,帮你捕捉行业趋势,搞米、找方案、找灵感......双11史上最低价,11.5号涨价100元,11.11结束恢复原价~~~