图片来源:Unsplash
根据金融时报报道,微软AI负责人穆斯塔法·苏莱曼(Mustafa Suleyman)挖走了其前同事——在Google DeepMind工作、并打造了其受欢迎的播客生成功能的团队成员。
苏莱曼2010年共同创办了DeepMind,他雇佣了Marco Tagliasacchi和Zalán Borsos,两位在Google AI研究工具NotebookLM中的“音频概览”(Audio Overviews)功能背后的资深科学家。该功能可以让用户将文本转换为具有吸引力对话播客风格的音频。
两人还参与了DeepMind即将发布的AI代理Astra的研发,该代理可以实时回答关于视频、音频和文本的问题。
第三位从DeepMind加入微软的成员是Matthias Minderer,他将专注于开发视觉能力,即AI模型分析图像的能力。这些研究人员将加入微软位于苏黎世的新AI实验室。
这三人于周二宣布了他们的跳槽消息。一位熟悉此事的人士表示,这些研究人员对苏莱曼推动下一代Copilot的工作至关重要,微软正在努力创建互动AI Agent,可以执行从预定航班到管理日程等任务。
苏莱曼在LinkedIn上写道:“这是一个出色的团队,将成为[微软AI]的一个重要中心,和我们位于伦敦的办公室一起,那里也在快速增长!”
Tagliasacchi在LinkedIn上写道:“AI仍然是一个变革性的力量,音频在塑造更自然、更直观、更沉浸式的互动中扮演着至关重要的角色。”
苏莱曼于2022年离开Google,转向风险投资,并随后创办了AI初创公司Inflection。他于2024年3月加入微软,并将Inflection的几名员工带到了这家美国科技巨头。苏莱曼还招聘了Google DeepMind健康AI部门的成员,以及DeepMind的知名AI研究员Nando de Freitas。Google也将顶尖AI人才输送给了竞争对手Apple。
微软和Google是致力于通过“多模态”AI模型创建代理的公司之一,这些AI模型能够分析和理解音频、视频或图像中的内容。
去年,OpenAI推出了ChatGPT的高级语音模式,例如,允许用户以更自然的方式与AI互动。Google的语音驱动AI代理Astra计划于2025年推出,而亚马逊则在寻求将AI模型引入其语音驱动的数字助手Alexa中。
参考资料
[1] Microsoft poaches DeepMind staff behind AI podcasting feature, https://www.ft.com/content/51bb0496-59ab-4a75-a410-14c097104594
稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。