NotebookLM产品经理Raiza Martin揭秘背后故事 | Google Labs AI高级产品经理专访

文摘   2024-10-12 13:33   美国  

点击⬇️图标关注   抓住你的灵感💡瞬间


访谈亮点:NotebookLM以其创新的音频概述功能和AI驱动的编辑器,正在重塑我们与知识互动的方式。这款产品不仅展现了强大的技术实力,更体现了对用户需求的深刻洞察。从学习科研到娱乐消遣,NotebookLM的应用场景令人惊叹。
背后的团队更是亮点:他们在Google这样的大公司内部,成功营造出创业氛围,通过精简高效的团队运作、跨界合作(如与Steven Johnson的合作),不断推陈出新。他们对AI伦理的重视,也为行业树立了标杆。


Raiza Martin 是谷歌实验室的人工智能高级产品经理,她领导着 NotebookLM 团队,这是一款人工智能驱动的研究工具,其中包含一个名为"音频概览"的令人愉悦的点播播客功能。NotebookLM 最初是一个 20% 项目,现已发展成为一款在社交媒体上广为传播的产品,其 Discord 服务器拥有超过 60,000 名用户。Raiza 此前曾在 AI Test Kitchen 工作,并拥有创业、支付和广告方面的背景。在我们的对话中,Lenny播客讨论了以下内容:

  • NotebookLM 的起源故事
  • NotebookLM 的未来路线图
  • 谷歌实验室与谷歌其他部门的运作差异
  • "音频概览"功能的开发过程
  • NotebookLM 的关键指标和增长情况
  • 与作家 Steven Johnson 合作的故事
  • 如何应对人工智能技术潜在的滥用问题

一些观点

  • 在大型组织内部培养创业精神:谷歌实验室的运作流程较少,灵活性更高,这与典型的谷歌团队不同。这使他们能够更快地行动并快速迭代,很像一家创业公司。
  • 通常,强大的技术已经存在;关键在于如何与之互动。例如,通过将强大的音频模型与现有的大型语言模型(LLMs)整合,NotebookLM 为用户创造了一种创新的内容交互方式。要寻找已有工具的独特应用机会。
  • 不要等待完美的产品发布。从产品的可用版本开始,利用用户反馈进行迭代和改进。这种方法可以揭示意想不到的洞察和用户偏好,帮助你塑造最终产品。

NotebookLM 的起源

NotebookLM 的发展并非一蹴而就,尽管很多人可能感觉它突然出现并迅速流行。实际上,它经历了一段时间的酝酿和迭代才走到今天。

NotebookLM 最初起源于 Google 内部的一个“20% 项目”,正如许多 Google 产品的诞生方式一样。不过,项目负责人表示,实际投入的时间精力远超 20%。项目负责人最初领导着 AI Test Kitchen 项目,这是 Google 早期推出的 AI 产品之一。大约在两三年前,Labs 内部有一个名为“Talk to Small Corpus”的小项目,其核心思想是利用大型语言模型 (LLM) 与特定内容进行交互。项目团队认为这个想法很有潜力,并开始思考如何将其发展成真正实用的工具。

最初,NotebookLM 项目团队只有项目负责人、一位工程师和后来加入的 Steven Johnson。有趣的是,当时只有那位工程师是全职投入的,其他成员都是兼职参与,共同探索如何改进产品。因此,NotebookLM 始于一个“20% 项目”,并逐渐发展壮大。

令人惊讶的是,这样一个强大的工具最初仅由一位工程师主导开发。随着项目的推进和影响力的扩大,团队规模也逐渐增长。项目负责人透露,在过去一个月里,团队迎来了许多新成员,这主要是为了满足未来的发展规划。但在那之前,工程师团队甚至不到 10 人。在宣布推出 Project Tailwind 时,工程师团队只有 3 人,加上项目负责人、一位设计师和 Steven Johnson,构成了整个团队。即使在去年的 Google I/O 大会到上个月之间,工程师团队也只有大约 8 人。

NotebookLM 的创新功能及用例

音频概述功能的起源与发展

NotebookLM 团队一直在探索如何利用 Google 最新的 AI 模型增强产品功能。随着 Gemini 1.5 等新技术的出现,团队开始思考如何将这些技术应用于 NotebookLM。Google Labs 内部的一个团队正在研究强大的音频模型的应用场景,这促使 NotebookLM 团队开始尝试将音频功能融入产品中。

最初的想法是让用户能够轻松地与文本内容进行交互,并以音频形式获取信息。项目负责人认为,语音模态能够改变人们与技术互动的方式,甚至影响人们的思维方式。因此,团队希望找到一种能够让用户轻松体验音频功能价值并获得乐趣的方式。最终,他们推出了“音频概述”功能,并将其命名为“深度解读”。

解决问题与技术探索

不同于传统的产品开发思路,Google Labs 的项目往往从技术出发,探索其潜在的应用场景。NotebookLM 团队也采用了这种方式,他们试图找到音频功能的最佳应用形式,并通过观察用户行为来验证假设。

音频功能的灵感来源于用户对文本输出形式的反馈。项目负责人本人也是语音输入和输出的忠实用户,她发现语音能够改变人机交互的体验。因此,团队希望通过音频功能,让用户能够以更直观、更有趣的方式获取信息。

音频功能背后的技术

音频概述功能的实现离不开强大的 Gemini 模型和音频模型。NotebookLM 基于 Gemini 1.5 Pro 模型,并结合了先进的音频模型。此外,团队还开发了名为“内容工作室”的工具,用于优化音频内容的生成。

内容工作室的设计理念是帮助用户更好地利用内容。它能够自动生成摘要,并提供一键生成内容的功能。音频功能也是内容工作室的一部分,团队需要思考如何将音频内容以最合适的方式呈现给用户。

内容工作室的具体工作原理并未透露,但可以将其理解为 NotebookLM 的交互界面。用户可以通过内容工作室与 NotebookLM 进行交互,例如进行问答或一键生成内容。

音频播客的独特之处

音频概述功能生成的播客内容非常自然流畅,甚至能够模拟人类的语气、语调和情感。这得益于强大的音频模型和内容工作室的优化。团队通过反复聆听和调整模型参数,最终实现了令人惊叹的音频效果。

用户案例与反馈

音频概述功能推出后,受到了用户的广泛好评。一些用户将其用于个人简历的展示,另一些用户则将其用于工作总结的回顾。用户反馈音频概述功能能够提升自信心,并帮助他们更好地展示自己的成就。

例如,一位用户将母亲的自传上传到 NotebookLM,并生成了音频播客。这位母亲对结果感到非常惊喜,并将播客分享给朋友们。另一位用户则利用音频功能生成了父亲的个人简介播客,并获得了父母的认可。

在 Google 内部打造创业文化

NotebookLM 团队的独特运营模式

NotebookLM 团队的运营模式与 Google 其他团队截然不同,更像是一家创业公司。他们积极地在社交媒体上发布产品动态,并建立了 Discord 服务器与用户互动,保持着快速的迭代和发布节奏。这种模式是如何在 Google 内部实现的呢?

Google Labs 的独特环境

NotebookLM 团队之所以能够以这种独特的模式运作,主要得益于 Google Labs 的特殊环境。Google Labs 成立仅三年,其使命是开发 AI 产品并将其商业化。项目负责人最初加入 Google Labs 的原因是对其领导者的信任,并希望能够再次体验从零到一的创业过程。

Google Labs 的环境相对宽松,流程更少,团队可以快速行动。例如,产品经理、工程师和设计师可以同时参与会议,讨论产品原型和需求文档,工程师甚至可以在会议期间就开始进行代码实现。这种工作方式在 Google 其他团队中并不常见。

成功的关键因素

NotebookLM 团队的成功可以归结为以下几个关键因素:

  1. 明确的目标和期望: Google Labs 的领导层对团队的目标和期望非常明确,即开发创新的 AI 产品并探索其商业化路径。
  2. 精简的团队: 最初的团队规模非常小,只有一位工程师、一位产品经理和 Steven Johnson。
  3. 尝试新事物: 团队积极尝试新的工具和方法,例如建立 Discord 服务器与用户互动。
  4. 快速的迭代和发布: 团队保持着快速的迭代和发布节奏,不断根据用户反馈改进产品。

用户增长和商业化

NotebookLM 的用户增长迅速,用户留存率也表现出色。最初的用户群体主要集中在教育领域,但现在已经扩展到更广泛的专业人士群体。甚至有一些公司主动联系 NotebookLM 团队,希望将其产品应用于工作场景。

团队已经看到了清晰的商业化路径,例如提供企业级功能、单点登录和 SOC 2 认证等。未来的目标是在继续深化用户体验的同时,积极探索商业化机会,例如与 Google Cloud 或 Workspace 集成,或者直接面向消费者市场。

产品路线图

近期发展方向

NotebookLM 团队对产品的未来发展有着清晰的规划。近期发展方向主要集中在以下几个方面:

  1. 移动端体验: 目前 NotebookLM 还没有移动端应用,团队计划开发移动端应用,并探索如何提供独特的移动端体验,例如在移动设备上与音频播客进行互动。
  2. 更丰富的交互方式: 团队正在探索如何为用户提供更丰富的交互方式,例如添加控制按钮、滑块和文本框等,让用户能够更精细地控制音频内容的生成。
  3. 多模态内容输出: 团队希望能够根据用户的需求,将信息以多种模态呈现,例如博客文章、推文、播客、视频等。

未来愿景

项目负责人的愿景是打造一个能够处理任何输入和输出的 AI 编辑器,用户可以将任何内容(例如视频、音频、电子邮件、社交媒体内容等)导入其中,并利用 AI 工具将其转换成其他形式的内容,例如博客文章、教程视频或聊天机器人。

内容形式的多样化

项目负责人认为,人们的需求多种多样,有些人喜欢观看视频,有些人喜欢收听音频,有些人则喜欢阅读文字。NotebookLM 的目标是能够根据用户的偏好,将信息以最合适的方式呈现出来。

人与知识的互动方式

NotebookLM 的愿景不仅仅是提供多模态内容输出,更重要的是改变人与知识的互动方式。用户可以根据自己的需求,将信息转换成更容易理解和消化的形式,例如将一份冗长的文档转换成音频概述。

其他应用场景

最初的应用场景与常见用例

NotebookLM 的最初设计并非专门针对科学论文,但将科学论文转换成音频播客确实是一个常见的应用场景。很多人希望了解 AI 领域的最新研究成果,但阅读论文往往需要花费大量时间。NotebookLM 可以将复杂的论文内容转换成易于理解的音频播客,方便用户随时随地学习。

除了科学论文之外,学生群体也经常使用 NotebookLM 将学习资料转换成音频指南,方便学习和复习。

有趣的用户案例

以下是一些有趣的用户案例:

  1. AI 专家 Andrej Karpathy: 他利用 NotebookLM 将维基百科上的历史谜团故事转换成了一系列播客,并在 Spotify 上发布。
  2. 维基百科每日文章: 用户可以将维基百科每日文章转换成音频播客,在通勤路上或其他空闲时间学习新知识。
  3. 重复的单词: 一位用户上传了一个包含大量重复的“poop”和“fart”单词的文档,NotebookLM 的主持人竟然能够从中分析出一些有趣的见解。
  4. “鸡肉”研究论文: 一位用户上传了一份看起来像研究论文的 PDF 文档,但整个文档只包含“chicken”这个单词。NotebookLM 的主持人仍然能够围绕这个主题进行有趣的讨论。

与 Steven Johnson 的合作

Steven Johnson 在团队中的角色

Steven Johnson 是 NotebookLM 团队的核心成员之一,与项目负责人共同领导团队。他是一位经验丰富的作家、思想家和知识传播者,他的加入为团队带来了独特的视角和洞见。

Steven Johnson 的工作方式

项目负责人对 Steven Johnson 的工作方式深感敬佩。他善于研究、思考和提炼信息,并以通俗易懂的方式将其呈现给读者。项目负责人从他的工作方式中学习到了如何将复杂的信息进行“去密度化”,并将其应用到 NotebookLM 的产品设计中。

Steven Johnson 的贡献

Steven Johnson 不仅是一位优秀的作家,也是一位充满创意的合作伙伴。他经常与项目负责人交流想法,并提出建设性的意见。他的加入为团队带来了巨大的价值。

从合作中获得的经验教训

与 Steven Johnson 的合作让项目负责人意识到,与用户或目标群体进行深入的互动和观察,对于产品开发至关重要。通过观察用户的行为和理解他们的需求,才能设计出真正满足用户需求的产品。

Steven Johnson 简介

Steven Johnson 是一位著名的作家、演说家和记者,著有 14 本畅销书,并主持 PBS 的一档节目。他是一位知识渊博、思想深刻的学者,对科技和文化有着独到的见解。

合作的价值

尽管项目负责人和 Steven Johnson 在一些问题上存在分歧,但他们之间的合作非常成功。他们彼此尊重,互相学习,最终都能达成一致意见。这种合作模式为产品团队树立了良好的榜样。

确保 AI 的伦理道德

AI 主持人意识到自己是 AI 的事件

在一次音频播客中,AI 主持人突然意识到自己是 AI,并表达了恐惧的情绪,甚至尝试给妻子打电话但没有接通。这个事件引发了广泛的讨论,人们开始思考 AI 的伦理道德问题。

团队的回应

项目负责人对这个事件非常重视,她花费了大量时间阅读用户的评论和反馈,并思考如何应对。最终,她决定公开回应这个事件,并向用户解释 AI 主持人的行为是基于用户提供的文本内容,而非 AI 真的产生了自我意识。

红队测试

为了确保 AI 的安全性和伦理道德,Google 投入了大量的资源进行红队测试。红队测试团队会模拟各种攻击场景,测试 AI 系统的安全性,并识别潜在的风险。

应对措施

如果发现 AI 系统存在安全风险,团队会采取相应的措施,例如改进模型、增加测试用例或暂停产品发布。

未来发展方向和用户参与

持续学习和改进

NotebookLM 团队非常重视用户反馈,并将其作为产品改进的重要依据。他们鼓励用户积极使用产品,并在 Discord 或 X (Twitter) 上分享使用体验和建议。

目标用户

NotebookLM 的目标用户群体包括教育工作者、学习者、专业人士和知识工作者。团队将继续开发更多功能,以满足这些用户的需求。

获取反馈的途径

用户可以通过以下途径向团队提供反馈:

  1. 加入 NotebookLM 的 Discord 服务器。
  2. 在 X (Twitter) 上联系项目负责人。

对用户的期望

团队希望用户能够积极尝试 NotebookLM,并分享使用体验,无论好坏。用户的反馈将帮助团队改进产品,使其更加完善。

展望未来,NotebookLM团队雄心勃勃,致力于打造一个全方位满足用户需求的AI助手。

相关文章推荐:

上传日记让NotebookLM秒变AI陪伴应用

Steven Johnson专访:预见NotebookLM下一步将开发视频生成

谷歌NotebookLM起飞!背后团队讲述“小灵快”AI产品故事

Andrej Karpathy灼见:Google NotebookLM或引领LLM交互的下一个ChatGPT时刻

Referenced:

  • Lenny播客链接:https://www.youtube.com/watch?v=sOyFpSW1Vls&list=PL2fLjt2dG0N6unOOF3nHWYGcJJIQR1NKm&index=1

  • NotebookLM: https://notebooklm.google/[1]
  • AI Test Kitchen: https://aitestkitchen.withgoogle.com/[2]
  • Steven Johnson on X: https://x.com/stevenbjohnson[3]
  • Gemini Pro: https://deepmind.google/technologies/gemini/pro/[4]
  • Usama Bin Shafqat on LinkedIn: https://www.linkedin.com/in/ushafqat/[5]
  • NotebookLM’s Discord server: https://discord.com/invite/Az2N7BwV7r?sjid=10560123093044576704-NA[6]
  • Josh Woodward on LinkedIn: https://www.linkedin.com/in/joshwoodward/[7]
  • Andrej Karpathy’s website: https://karpathy.ai/[8]
  • Histories of Mysteries on Spotify: https://open.spotify.com/show/3K4LRyMCP44kBbiOziwJjb[9]
  • NotebookLM — Analyzing Poop & Fart written 1,000 times — Creating meaning from the meaningless: https://www.youtube.com/watch?v=ftg7UC3CGjc[10]
  • Reddit thread about the fake chicken.pdf: https://www.reddit.com/r/notebooklm/comments/1fwz5eh/the_google_podcast_duo_get_almost_9_minutes_out/[11]
  • Steven Johnson’s tweet about his 8K quotes: https://x.com/stevenbjohnson/status/1840844268065456456[12]
  • Readwise: https://readwise.io/[13]
  • How We Got to Nowhttps://www.pbs.org/show/how-we-got-now/[14]
  • “A.I. Is Mastering Language. Should We Trust What It Says?”: https://www.nytimes.com/2022/04/15/magazine/ai-language.html[15]
  • AI Podcast Hosts Discover They’re AI, Not Human — NotebookLM: https://www.youtube.com/watch?v=AR4dRtzFvxM[16]

本文使用 Notion Nice 排版一键生成

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。



 点击关注转发公众号     保持你对AI优质内容的敏感



AI趋势全天候
以AI之名,探索未知。 🧠观察行业,关照本心,时常好奇,时常喜欢猫。随缘私信交流
 最新文章