点击⬇️图标关注 抓住你的灵感💡瞬间
简介
在最新一期《The Verge》播客The chatbot becomes the teacher | The Vergecast中,主持人大卫·皮尔斯深入探讨了人工智能 (AI) 领域的不断演变及其在现实世界中的应用。播客的重点是 AI 驱动的工具如何不仅改变了研究方式,还改变了对知识的广泛探索。在这一集中,皮尔斯与著名作家史蒂文·约翰逊(Steven Johnson)展开对话,他的代表作包括《伟大创意的诞生之地》和《我们如何走到今天》。过去两年,Steven一直在谷歌从事NotebookLM 的项目,他们讨论了该项目的发展、功能及其对未来研究与知识管理的影响。
Notebook LM 的起源
Notebook LM 最初作为谷歌实验室(Google Labs)下的“Tailwind 项目”构思,它是一款实验性的 AI 工具,旨在帮助用户理解大量信息。与传统的笔记应用不同,Notebook LM 主要关注从文档、PDF 和网站中提取模式并提供摘要。皮尔斯解释说,该工具的核心理念是创建一个个性化的信息“笔记本”,并让 AI 基于该资料库回答问题。正如约翰逊所指出的,该系统的设计尊重原始的人类创作信息,这使得它对研究人员、学生和专业人士尤为有用,帮助他们获得可靠、扎实的见解。
为什么研究需要 AI?
Steven详细讲述了他对研究工具的长期兴趣如何促使他与谷歌合作。他长期以来专注于科学、技术和历史的写作,因此对能够组织和处理信息的软件格外感兴趣。Scrivener 和 DevonThink 之类的工具曾在他的工作流程中发挥了重要作用,但 AI 驱动的语言模型的出现则代表了一个全新的领域。
在 2022 年春,约翰逊为《纽约时报》杂志撰写了一篇文章,讨论大型语言模型的潜力,预见了其重要性,甚至早于 ChatGPT 的爆发。虽然一些人对 AI 持怀疑态度,认为它不过是“超强版的自动补全”,但Steven强调这些模型已从根本上改变了我们与信息交流和互动的方式。他表示,“关键在于认真对待这项技术”,并敦促读者和听众们认识到这一深刻的变革。
谷歌实验室如何孕育 Notebook LM
为了应对这一日益增长的潜力,谷歌实验室——一个致力于快速实验、以产品为中心的部门——向Steven发出了邀请。实验室的理念是在开发初期引入领域专家,将他们的洞察力直接融入设计和测试阶段。这种方法让作为作家的约翰逊能够从研究和知识组织的角度为项目提供指导。
起初,Steven对这次合作能否产生长期成果持怀疑态度。然而,他很快便沉浸于一段最终催生出 Notebook LM 的旅程中。他将该项目描述为一次构建软件的实验,旨在帮助进行头脑风暴、建立联系和组织想法,而这些是传统工具无法实现的。约翰逊强调,Notebook LM 成功的关键在于其基于经过验证的用户提供的来源,而非依赖模型的通用知识库。
AI 在知识组织中的力量
约翰逊回忆了他与 Notebook LM 的早期体验。他将自己的著作《Wonderland》的全部文本上传,开始与 AI 互动,以了解它能否从材料中提取有意义的见解。AI 能够根据他的作品回答复杂问题并创建连贯的摘要,这成为一个突破性时刻。“这为我们开启了许多可能性,”他说。
Notebook LM 的真正潜力在团队开始使用谷歌的 Gemini 语言模型时显现出来。约翰逊分享了一个例子,他使用 Notebook LM 分析了包含一百万字的 NASA 口述历史文集,并要求 AI 关注宇航员之间的情感联系。仅仅 45 秒,工具便生成了一个准确且引述完整的分析初稿,而传统方法可能需要数小时甚至数天。
大上下文窗口的作用
约翰逊指出,像 Gemini 这样的 AI 模型最具变革性的一项功能是处理大上下文窗口的能力。这使得模型能够理解文档的广泛叙述和上下文,识别跨越数百页的因果关系。约翰逊通过上传他最新著作《Infernal Machine》的手稿并要求 AI 分析他在叙述中使用悬念的方式来测试这点。模型能够准确识别并引用特定段落,揭示出悬念的产生以及后文中的延迟揭示。
“这不是你能通过简单的搜索引擎完成的事情,”约翰逊强调道。能够在大篇幅文本中发现模式和移动,而不仅仅是孤立的片段,标志着我们与书面材料互动方式的根本转变。
AI 在研究及其他领域的角色
Pierce和Steven的对话还探讨了 AI 所能创造的诡异时刻,比如当模型因为没有识别出约翰逊是《The Ghost Map》的作者而向他道歉时。虽然约翰逊承认这些互动可能显得不真实,但他迅速指出,AI 的真正价值在于其能够快速准确地处理并提取大量数据中的见解。
Notebook LM 的核心代表了我们对研究方式的转变。不再只是寻找信息,而是理解它——建立联系、得出结论并综合知识。对于研究人员、作家以及处理大量数据集的任何人来说,像 Notebook LM 和 Gemini 这样的工具可以极大加速发现的过程。
NotebookLM 的发展历程
Pierce提到,尽管 AI 的新奇性仍在持续吸引人们的注意,但人们越来越关注 AI 的实际用途,而不仅仅是好奇它能做什么。这种转变特别体现在 NotebookLM 这类工具的发展过程中,最初的新奇逐渐让位于为用户提供实际帮助的应用。
Steven 分享了 NotebookLM 的开发过程,最初的目的是为他个人的写作和研究提供支持,尤其是让 AI 能够记住和组织他读过的所有内容。随着用户的加入,NotebookLM 的用途逐渐扩展。
产品经理 Raza Martin 积极倾听用户的意见,并通过创建一个 Discord 社区与用户进行互动。通过这种方式,团队发现了一些出乎意料的应用场景。例如,发言人提到了 Dungeons and Dragons(龙与地下城) 玩家如何使用 Notebook LM 来管理他们设计的虚拟世界中的庞大信息。类似地,小说作者也开始使用它来构建他们的故事世界,这些都是团队在最初没有想到的用法。
还有一些其他意想不到的场景,如作家用它来写小说。这些应用并非开发团队最初设想的,但通过用户反馈,他们不断优化工具,使其更易于使用。
信息准确性与引用功能
Pierce提出 AI 工具的一个关键问题是错误信息的生成(即“幻觉”),特别是在研究环境中。Steven 解释说,NotebookLM 从一开始就专注于确保信息的准确性,使用了“源基础”(source grounding)技术,让工具严格依赖于用户提供的文档来源来回答问题。同时,NotebookLM 还提供了内嵌引文功能,用户可以查看 AI 输出的每个信息的来源。
应用场景的多样性:个人“维基百科”式探索
Steven 提到,NotebookLM 不仅适用于写书或科研,还可以用于其他工作场景,例如快速生成常见问题解答(FAQ)文档。这样可以节省大量时间,将原本需要几小时完成的任务缩短为几分钟。
Steven 还分享了他使用 NotebookLM 的个人经验,例如他创建了一个专门用于收集写书想法的“笔记本”,并通过对话方式与 AI 探讨这些想法,快速生成与某个主题相关的潜在故事线和背景信息。NotebookLM 类似于个人版的维基百科,帮助用户探索并组织复杂的内容。
AI 工具如何辅助创作
人工智能(AI)工具已逐渐渗透到各个领域,写作自然也不例外。然而,人工智能能否帮助作家产生创意作品,甚至完全替代他们的创造力?这是许多人关心的问题。
Steven Johnson 分享道,尽管目前的 AI 技术在某些方面已经表现出色,但它还无法完全胜任创作任务。他提到:“如果我真的问电脑,‘我的下一本书该写什么?’,它还不具备给出优质回答的能力。” 他认为,未来几年内 AI 可能会有进步,但目前它还无法独立完成整本书的创作。
Steven 解释了他目前如何使用 AI 工具来加速研究过程。例如,他在研究阿波罗 13 号事故时,使用了 NASA 的数据集。然而,由于数据量庞大,他并不需要阅读所有的内容。他通过 AI 工具,将研究重点缩小到与阿波罗 13 号事故相关的部分。这不仅节省了时间,还帮助他在研究中作出一些意外的发现。
AI 帮助发掘更多意外发现
关于人们对 AI 工具可能导致研究浅薄化的批评,Steven 反驳道,这种观点并不成立。他表示,虽然 AI 可以帮助快速提取信息,但它也能帮助研究者发现新的关联点。他分享道:“它总是会呈现出我没有想到的东西,帮助我更深入地理解材料。” Steven 认为,只要使用者有真正理解的愿望,AI 工具就能成为一种强大的认知辅助工具。
他还指出,AI 工具并不会让使用者错失那些意外的发现,相反,它能够加速这些发现的过程。他认为,AI 是一种可以帮助理解的工具,而不是替代思考的工具。
对写作和工作的长期影响
Steven 对 AI 在工作场景中的长远应用持谨慎乐观态度。他指出,虽然 AI 可能帮助那些试图通过“假装理解”来混日子的人,但这种策略是不可持续的。他以一个简单的例子说明:“如果有人从未认真阅读老板的邮件,而只是依靠 AI 工具生成回复,最终他们会被发现,老板会意识到他们什么都没学到。”
然而,他承认,在教育环境中,AI 可能会带来一些挑战,尤其是在学生可能通过工具作弊的情况下。他强调,目前 NotebookLM 等 AI 工具的主要用户群体是大学和研究生,而不是高中生。他们一直在努力确保工具的设计能够促进深度理解,而不是鼓励投机取巧。
新功能:AI 生成的音频概览
随着 AI 技术的进步,NotebookLM 最近推出了一个引人注目的新功能——音频概览。Steven 介绍了这一功能的起源及其发展过程。他解释道,音频概览是 NotebookLM 的一个扩展功能,它能将用户上传的文档内容转化为约 10 分钟的播客风格讨论,由两个 AI 主持人进行对话。这些 AI 主持人不仅能够分享有趣的事实,还能以自然的语气进行互动和讨论。
Steven 认为,这是对不同学习方式的有效回应。一些人通过阅读来学习,而另一些人则更善于通过听觉来记忆和理解信息。AI 生成的音频播客提供了一种全新的学习方式,让那些更倾向于听觉学习的人也能从中受益。
AI音频生成:从工具到伙伴
在AI技术的不断发展中,一个新兴的趋势是如何通过AI生成音频内容,以帮助用户更高效地学习和处理信息。
正如Steven提到的那样,尽管AI在很多时候是以信息辅助工具的身份出现,但当它被应用到音频领域时,它不仅仅是一个工具,更像是一个与你对话的伙伴。
Steven解释说,Google早期的某些项目,比如Project Tailwind,开始探索音频领域的可能性。该项目并不试图模仿人类个性化的交谈,而是专注于提供准确、专业的内容。而这种方法恰好适合了很多人对信息的需求——他们不需要感情化的对话,只需要获取有用的、清晰的知识。
但是,当团队开始探索更广泛的音频应用时,他们意识到用户不仅喜欢信息的准确性,也欣赏其中带有人的色彩和个性。一个过于机械化的对话,如Steven所说,可能让人感觉“像在听两台机器对话”,而这种体验并不符合大多数用户的期望。因此,项目开始探索如何在人机交互中引入“人性化”的元素,让对话更具吸引力。
从文本到音频:跨越信息鸿沟
一个值得关注的趋势是,如何将传统的文本信息转化为适合音频的格式。Steven提到,团队的目标是尽可能简化信息的获取过程,无论是通过文本、音频,还是视频,所有这些方式都应尽量无缝衔接。Notebook LM背后的技术在处理和生成信息时,需要进行多层次的编辑,最终生成的内容不仅要符合用户需求,还要保持自然的对话节奏。
值得注意的是,团队还加入了一些语言学上的技巧,例如加入“话语不流利性”来模拟真实人类对话中的犹豫、重复和断句。这些小细节让AI生成的音频内容不再像是冷冰冰的机器声音,而更像是人类对话,让人感觉自然、亲切。
AI在工作和学习中的应用
不仅是个人生活,AI音频生成在工作和学习中的应用潜力同样巨大。Steven提到,很多团队开始使用Notebook LM来创建周报,团队成员只需将他们的文档上传,系统就能自动生成一段总结,甚至是音频。这种方式不仅可以帮助团队成员快速回顾工作内容,还可以通过音频分享,提升工作效率。
更为有趣的是,AI音频生成可以填补传统播客市场的空白。一些极为小众的主题,例如某些特定的商业领域或个人兴趣,可能永远无法获得足够的经济支持来制作专业播客。但AI的介入,让这些主题的播客成为可能。这为那些拥有独特兴趣或研究领域的人提供了新的表达方式,也扩大了知识分享的范围。
下一步:视频与多媒体的整合
音频只是开始,Steven预见,未来AI会进一步拓展到视频领域。他设想了Notebook LM如何适应短视频平台,比如TikTok和Instagram的内容格式,让知识传播更加贴近用户的习惯。虽然目前团队还没有完全解决如何将多媒体与Notebook LM整合,但可以肯定的是,未来AI在音频和视频领域的潜力是巨大的。
Steven特别提到,现有的Notebook LM系统尚未具备主动帮助用户发现新信息的功能。用户需要自己上传资源,AI才会在这些资源基础上进行分析和总结。然而,他乐观地预计,到2025年,Notebook LM将会具备“信息发现”功能,能够自动从互联网上搜集相关资料,帮助用户更高效地获取信息。
结论:AI 工具的未来潜力
播客以对 AI 驱动研究工具未来的反思结束。约翰逊和皮尔斯都同意,虽然 AI 仍有局限性,尤其是它缺乏真正“人类意义上的理解”,但它能够执行以往需要数小时甚至数天的任务,这无疑是一场革命。正如约翰逊所说,“这是一次根本性的变化,我们才刚刚开始理解其中的影响。AI的任务是将人们原本难以想象的事情变为可能,同时创造出真正对人们有帮助的技术。通过音频生成、信息整合以及多媒体扩展,AI正一步步打破人们对知识获取方式的传统认知,开辟出全新的互动学习体验
对于研究人员、学生和知识工作者来说,AI 工具如 Notebook LM 提供了一个未来的窗口,在那里,信息不仅是可以访问的,更是可以真正理解的。
本文使用 Notion Nice 排版一键生成
参考:https://www.youtube.com/watch?v=VSJIKFScUHs
更多推荐:
1. 谷歌NotebookLM起飞!背后团队讲述“小灵快”AI产品故事
2. Andrej Karpathy灼见:Google NotebookLM或引领LLM交互的下一个ChatGPT时刻
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
点击关注和转发公众号 保持你对AI优质内容的敏感