2,目前 AI 音频生成领域的竞争已处于白热化状态,OpenAI 与其他顶级生成式 AI 公司都在投资语音模型,核心目的是:如果您已经是我的知识星球用户,可以通过下方二维码直接跳转到星球阅读全文。如果您不是,可以在购买该“AI 新应用”合集后阅读专栏下的所有文章。
这两天,英伟达展示了它在 AI 音频生成领域的大动作。具体来说:英伟达展示了它可以修改声音并生成“前所未闻”的新声音的 AI 模型——Fugatto。所谓“前所未闻”是指,它可以叠加两种不同的声音效果来创造新东西。例如:英伟达展示了如何在生成火车的声音之后变成管弦乐,以及逐渐消失在远处的暴雨声。这些都是我们在 AI 音频生成领域从来没见过的功能。当然,英伟达该技术主要针对的是好莱坞,包括音乐、电影与视频游戏制作者的市场。