背景介绍
Raiza Martin 是 Google Labs 的高级 AI 产品经理,她领导着 NotebookLM 背后的团队。NotebookLM 是一款 AI 驱动的研究工具,其中包含了一个令人愉悦的点播播客功能,名为 "Audio Overviews"。
NotebookLM 最初是 Google 的一个“ 20% 项目”,现已发展成为一个在社交媒体上广为流传的产品,被 Andrej Karpathy(前特斯拉 AI 高级总监、前 OpenAI 研究员,目前正在参与构建 Eureka Labs AI)称赞说“产品里蕴藏着类似 ChatGPT 的机会”,其 Discord 频道拥有超过 60,000 名用户。
视频来自:https://www.youtube.com/watch?v=sOyFpSW1Vls
三个你可以收获的 take away
1.NotebookLM 最初是作为一个“20%项目”开始的,由一个小团队在Google实验室(Google labs)中孵化而成,拥有这么好的效果主要是靠谷 Gemini 1.5 Pro 背后的长文本能力和 TTS 模型。
2.NotebookLM 未来希望能成为一个“混搭的多模态 AI 内容改造服务”,用户可以输入任何内容,比如他的视频、音频、文件、LinkedIn、Twitter、博客文章等,并通过 AI 来将这些原始材料改造成新的媒介形式,比如博客文章、教学视频、对话机器人等。
3.这期播客分享了 NotebookLM 有丰富的应用场景,比如上传家人的自传生成音频节目、上传绩效评估材料生成有利于员工进行绩效面谈的材料等。
NotebookLM 是怎么诞生的?
这个项目最初是作为一个“20%项目”开始的,由一个小团队在Google实验室(Google labs)中孵化而成。
注:谷歌有一个著名的政策,允许员工将其 20% 的工作时间用于个人项目或公司主要业务之外的创新项目,这个政策的目的是鼓励产品创新。
这个政策最早是由谷歌联合创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)在2004年提出的,许多谷歌的知名产品最初都是20%项目的成果,例如 Gmail、Google News、AdSense等。
项目的起源可以追溯到 2022 年左右,当时 Raiza 正在领导 AI Test Kitchen 项目,这是一个旨在探索人工智能在实际应用中的潜力的实验性平台。她注意到实验室里有一个名为 "Talk to Small Corpus" 的小项目,该项目的核心理念是利用大语言模型与特定内容进行交互,以探索其潜力。
Raiza 和一位工程师开始深入研究如何改进这个想法,使其更加实用。随后,Stephen Johnson 也加入了团队。最初,项目规模较小,仅有一位工程师全职投入,其他人则是断断续续地参与。尽管如此,项目逐渐发展壮大。在 Google I/O 大会首次亮相时,团队由 Raiza、三名工程师、一名设计师和 Steven 组成。即使在项目公开后的很长一段时间里,团队规模也保持在不到 10 名工程师。
NotebookLM 的一个重要功能是 “深度探索”,这是一个音频概览工具,特别适用于播客内容。这个功能的灵感来自于 Google 内部另一个团队开发的强大音频模型。该团队开始思考如何将这项技术应用到 Notebook 中,最终开发出了一个能够根据简单输入生成流畅自然的播客内容的产品。
与传统的产品开发方式不同,NotebookLM 是从技术出发,而不是从需求出发。团队面临的挑战是如何找到这项技术的实际应用,以及如何以有意义的方式为用户创造价值。在开发过程中,他们特别注重用户体验,力求让用户真正从产品中感受到乐趣。
她观察到,语音交互模式改变了人们与技术互动的方式,以及对技术的感受。团队的目标是创造一个既能轻松提供价值,又能让用户感到有趣的产品。这个项目的发展过程展示了如何将现有技术塑造成更贴近用户需求的形式,就像 ChatGPT 一样,NotebookLM 通过新的交互方式,让用户重新认识到大语言模型的潜力。
NotebookLM 为何能有这么好的效果?
NotebookLM 能取得如此显著的效果,技术层面上要归功于以长文本能力著称的 Gemini 1.5 Pro 和Google 卓越的 TTS 技术。
在系统设计方面,NotebookLM 能生成令人惊喜的内容,主要得益于一个创新的系统 —— 被称为 “内容工作室” 的提示工程系统。
这个系统不仅能够生成内容摘要,还提供了丰富的互动选项,使得用户能够轻松创建新内容。
在开发过程中,团队面临的一个主要挑战是如何让生成的音频内容听起来自然且引人入胜。为此,他们投入了大量时间来倾听和分析生成的音频,以优化模型的表现。
例如,团队成员会在不同的环境和时间段反复聆听这些音频,确保其质量和自然度。
最终,NotebookLM 生成的播客内容不仅主持人之间的互动和笑声自然流畅,语气的起伏也十分逼真。这些效果的实现,是模型、内容工作室系统以及精心设计的提示词工程共同作用的结果。
NotebookLM 有哪些有意思的使用场景?
播客主理人 Lenny 将母亲的自传输入到 NotebookLM 中,成功生成了一个播客版本,这一创新不仅让家人惊喜不已,还激发了他创建相应的学习指南的兴趣。这一案例展示了 NotebookLM 如何将文字内容转化为音频,为用户带来全新的体验。
Raiza 则展现了 NotebookLM 在职场沟通中的潜力。她将父亲在医院工作的简历转化为音频,使家人得以更直观地理解父亲工作的价值和重要性。这种将文字信息转化为音频的方式,不仅增强了信息的传递效果,也促进了家庭成员之间的理解。
在 Google 内部,NotebookLM 的应用主要集中在人力资源领域。用户上传简历后,系统会生成一段充满活力的音频,描述其经历和能力,为求职者提供了一种新颖的自我展示方式。这种独特体验不仅给使用者带来了意外的惊喜,还显著提升了他们的自信心。
此外,NotebookLM 在 Google 内部的季度绩效评估中也找到了新的应用场景。员工只需上传季度检查笔记,系统便能生成音频概述,极大地简化了繁琐的文书工作,并有效提升了员工的自信心。许多员工表示,通过 NotebookLM 生成的积极评价,他们在绩效面谈中表现得更加自信和积极。
Lenny 和 Raiza 还探讨了 NotebookLM 的其他潜在用途,例如将科学论文转化为播客,以及将学习材料转换成音频指南。
在内容创作上,最令人印象深刻的是 Andrew Karpathy 创作的 “神秘历史” 播客系列,这一系列将维基百科上的历史谜团故事转化为引人入胜的音频内容。
不止这些,用户还发掘了许多高贵啊的场景,一个有趣的例子是,有人上传了仅包含 “便便” 和 “放屁” 两个词的文档,而 NotebookLM 的主持人却能够对其进行深入浅出的分析。
NotebookLM 背后有哪些故事?
NotebookLM 最主要是 Google labs 孵化出来的,与传统的 Google 产品不同,这个项目采用了更像创业公司的运作模式。
项目团队每天在社交媒体上分享项目进展,保持高度的透明度和互动性。他们建立了一个Discord 频道,目前已吸引了约6万名用户参与讨论和反馈。
这种非传统的运作方式在Google内部是相当罕见的,但它展现了在大型科技公司中进行创新的新可能性。通过采用更加灵活和开放的方法,项目团队成功地将一个技术创新转化为了广受欢迎的实用工具,不仅服务于公司内部,还吸引了大量外部用户的关注。
当 Raiza 加入 Google Labs 时,她对这一部门的使命并不了解,但她被与前老板 Josh Woodward 合作的机会所吸引。Josh是 Google Labs 的副总裁,他的明确目标是利用AI技术推出产品并建立相关业务。
这一工作变动对 Raiza 来说是一个巨大的转变,因为她之前的工作领域是支付和广告,而现在她需要迅速学习 AI 相关的知识。
这种理念使得NotebookLM能够在 Labs 内部以独特的模式运作。Labs团队的工作环境允许他们快速行动,流程简化,有时甚至简化到了极致。
团队会议通常包括产品经理、工程师和设计师,大家会同时讨论产品设计和需求文档,甚至在会议进行时就开始实施,这种敏捷的工作方式与 Google 传统的结构化流程形成了鲜明对比。
许多公司都在尝试创建类似的团队,专注于前沿科技的研究,但很少有成功的案例。
即使在Google,过去的类似尝试也大多未能取得显著成果。因此,NotebookLM的成功为其他团队提供了宝贵的经验。
从长期来看,NotebookLM 希望成为一个什么样的产品?
NotebookLM 希望在未来成为一个“混搭的多模态 AI 内容改造服务”,用户可以输入任何内容,比如他的视频、音频、文件、LinkedIn、Twitter、博客文章等,并通过 AI 来将这些原始材料改造成新的媒介形式,比如博客文章、教学视频、对话机器人等。
他们最近正在研究怎么把 NotebookLM 变成一个移动端应用,在未来,这个移动端应用不止有当前的这些功能,还可以让用户通过滑块、旋钮等交互方式,来调整 AI 输出的内容的情绪、风格等特征。
NotebookLM 的团队是如何协作的?
Raiza 描述的工作方式有几个关键特点:
Google 高层给 NotebookLM 团队提出了明确的期望,他们明确表示这是一个特殊的团队,将采用不同的工作方式,不会走常规的审批流程,而是公开地构建产品,不一定要有明确的目标,而是专注于研究酷炫的技术,看看会发生什么。
团队的规模很小,最初只有一个工程师,然后是一个产品经理和 Stephen Johnson,这种小团队模式被认为是成功的关键。
同时,团队被鼓励尝试新事物。例如,她从一开始就提出要建立一个Discord频道,这在Google内部是一个非常规的想法,但最终得到了支持。
在刚刚决定建立 Discord 频道时,Raiza 很担心的是没有人加入,但事实证明,这一决策非常成功,现在已经有 6 万人加入了这个频道。
NotebookLM的留存率增长速度非常可观,无论是日留存、周留存还是月留存。用户群体也发生了变化,从最初的教育工作者和学习者为主,到现在吸引了越来越多的专业人士。
使用 NotebookLM 的企业客户数量增长得非常快,现在已经到了 Raiza 需要雇佣一个业务开发人员的程度,因为她每天都要接一个客户电话,这让她感到非常兴奋。
NotebookLM 团队如何保证产品的安全性?
NotebookLM 团队采用了全方位的安全保障措施,确保产品的可靠性和安全性,核心策略涵盖了大规模的红队测试,由专业团队对各个安全领域进行深入评估,并且不断更新测试用例,以应对新出现的潜在风险。
团队在始终密切关注用户的反馈和使用习惯,以便及时调整安全策略。
在产品设计的初期,团队就将安全因素纳入考量,并保持高度警觉,随时准备应对可能出现的安全问题。我们采取公开透明的沟通策略,以增强用户的理解与信任。
这种多层次、持续的安全框架融合了技术测试、用户行为分析、公众沟通和人工监督,构建了一个动态的安全生态系统。
end
往期回顾
2024-10-13
2024-10-09
2024-10-06
2024-10-01
2024-09-29
2024-09-25
我们长期关注全球创新方向,如果您也对此感兴趣,或是相关创业者,欢迎微信添加“86566619”联系我。