Andrej Karpathy灼见：Google NotebookLM或引领LLM交互的下一个ChatGPT时刻

文摘 2024-09-29 16:26 广东

点击⬇️图标关注抓住你的灵感💡瞬间

一早这位赛博活佛Andrej Karpathy（前OpenAI成员、前Tesla自动驾驶负责人、李飞飞高徒）又在社交媒体发表了惊人的洞察：“NotebookLM 播客节目生成可能触及极具吸引力的 LLM 产品格式的全新领域。感觉让人想起 ChatGPT。也许我反应过度了。”

Google NotebookLM简介

这是一款谷歌的大模型笔记应用，已有一年多的历史。支持文档、音视频上传，类似于内置RAG能力的综合笔记软件。用的大模型是Gemini pro，现在免费（谷歌服务在国内无法使用）！整个产品历程如下：

初次亮相

2023年5月: 在 Google I/O 大会上,谷歌首次介绍了代号为 Project Tailwind 的 AI 笔记本项目。

正式命名与初步推出

2023年7月12日: Google 正式将 Project Tailwind 更名为 NotebookLM,并开始向美国的一小部分用户推出这款实验性产品。

功能扩展与全球化

2024年4月10日：NotebookLM 进行了重大更新,扩展了功能并提高了可用性。

2024年9月11日：谷歌宣布 NotebookLM 已经在全球范围内推广,并新增了音频概览(Audio Overview)功能，允许用户将文档转换为 AI 生成的音频讨论。

2024年9月18日：NotebookLM 作为附加服务在全球超过100种语言中可用。（支持youtube视频来源）

定位是研究助手

基于提供的文件，LMnotebook在问答中进行引用

国内ip会提示无法使用

播客生成就在整个“笔记本指南”的右上角，技术上其实是左侧“帮我创作”几个能力的整合，总结->双人播客对话形式文本转换->文本转语音TTS。

只不过这个播客音频质感是可以的。下面以我写OpenAI o1的宏大叙事与 AlphaGo的第37手这篇文章对o1安全文档分析为例。

当然其实，谷歌也很对播客产品的准确性和局限性做了详细说明，比如只支持英语。

Andrej Karpathy的推荐【译】

NotebookLM 非常强大，值得一试。

它有点像对使用 LLM 的 UI/UX 的重新想象，围绕你上传的一系列资源组织，然后通过查询参考这些资源，查看结果的同时附带引用信息。

但目前最新、最令人印象深刻的功能（有点出人意料地隐藏起来，像是个补充功能）是能够基于你上传的任何内容生成一个双人播客节目。例如，有人将我很久以前写的《从零开始的比特币》文章：^[1]，转成了播客，效果相当不错：^[2]，你可以将任何东西播客化。我上传了 train_gpt2.c（训练 GPT-2 的 C 代码）：^[3]；并基于此生成了一个播客：^[4]

虽然我不完全同意对话中的框架、重点或是对 layernorm 和 matmul 等的描述，但这里展现了一些伟大的潜力，而且无论如何，它都非常有趣。

在我看来，LLM 的能力（智力水平、记忆能力（上下文长度）、多模态等）已经远远超越了目前的 UI/UX 设计。想想 Code Interpreter、Claude Artifacts、Cursor/Replit、NotebookLM 等等。我非常期待看到更多不同的交互范式，而不仅仅是聊天功能。

这也是我认为双人播客格式作为 UI/UX 探索如此有吸引力的原因。它解决了两个使用 LLM 的“享受障碍”。

聊天不容易。你可能不知道该说什么或问什么。在双人播客格式中，提问的任务也交给了 AI，因此体验更加轻松，不再需要在生成过程中同步思考。
阅读比较累，而坐着听则轻松得多。

LLM交互范式案例分析

以下，我们对Karpathy提到的几个产品，在LLM的交互方式与ChatGPT的差异进行分析

Code Interpreter代码解释器

关键改进：代码解释器扩展了大语言模型的能力，超越了简单的语言任务，增加了直接分析数据、执行计算和创建可视化图表的计算功能。

UI/UX 改进：用户可以更直观地与数据交互，无需提出复杂的数学问题或了解编程语法。这降低了不擅长数据的用户的认知负担。

范式转变：互动从纯文本交流转变为 LLM 直接操作数据的模式。这使得用户能够更有效地获得可执行的见解或计算结果，而无需通过冗长的对话进行沟通。

Claude Artifacts：

关键改进：Claude Artifacts 专注于根据用户输入生成精心策划的成果（例如报告或特定的产出物）。

UI/UX 改进：用户无需通过多次互动引导对话并不断完善输出，Claude Artifacts 可以更加自动化地生成结构化的成果，减轻了用户多次引导对话的需求。

范式转变：该工具从同步的“问答”格式转变为更具任务导向的互动。用户在一开始就明确自己的需求，系统则交付最终成果，类似于自动内容创建，而不是通过迭代的问答过程。

Cursor/Replit（AI 驱动的开发环境）：

关键改进：Cursor 和 Replit 将 AI 嵌入到编码环境中，允许用户在实时 AI 帮助下进行编程（如自动补全、调试等）。

UI/UX 改进：用户无需在聊天窗口和编码环境之间切换，使得 AI 帮助编程变得更加无缝。AI 在用户编写代码时提供上下文建议和代码改进，减少了在不同模式（如询问 AI 与编写代码）之间切换的摩擦。

范式转变：这提供了一种“合作伙伴”体验，使 AI 成为编程的协同助手，减少了明确提问的需求。AI 直接嵌入用户的工作流中，提供及时帮助。

NotebookLM：

关键改进：NotebookLM 将 LLM 直接集成到知识组织工具中，使用户更容易与个人或工作相关的文档进行交互和查询。

UI/UX 改进：用户无需事先知道该如何提问，系统可以从他们的笔记或文档中提取相关信息。这减少了构建完美问题的认知负担，因为 AI 会根据用户的数据提供上下文并挖掘洞察。

范式转变：类似于参考书的类比，NotebookLM 将互动从主动的“提问”转向更被动的相关洞察检索。它弥合了处理个人知识和提问之间的差距，消除了摩擦，使用户更容易从他们自己的内容中获得上下文感知的回复。

LLM范式变迁要点总结

从聊天到目标导向的界面：传统聊天界面通常要求用户知道该问什么，这会带来认知挑战。这些新工具将互动转向实现目标（如分析数据、编写代码、生成成果），而无需用户过多的干预。
减少同步限制：这些工具中的许多已经从“来回对话”模式转向异步或任务导向的互动，使用户能够以更少的努力获得更丰富的输出。
增强的上下文处理：NotebookLM 和代码解释器等工具通过直接处理结构化输入（文档、数据）而不是仅依赖用户提供的提示词来增强内存和上下文处理能力。

这些工具正朝着更自然、集成化的 AI 交互方向发展，降低了使用门槛，使 LLM 的使用更加复杂和多样化。

AILin师傅看法

正面： “有趣”和“有用”，这两方面是一项新技术进入工程化阶段需要迈过的两座大山，有趣低于枯燥的进入门槛，有用是持续汰换、量变引入质变的核心，才能够抵达被普罗大众广泛接受的基础，缺一不可。
笔记应用通过播客的形式走红，证明对于一向通用技术仅是证明有用很难出圈，融入用户原有的消费情景中才能产生AHa moment。
反面：从Demo到产品还有很长的路要走，大模型在舆论场处于绝对的“靓仔”位置，但逃不过“看山是山、看山不是山、看山还是山”的演变路径。
在推文中Andrej Karpathy也提到并不认可LMnotebook对他文章的总结，这说明没有用户主导的介入的内容可能偏离原文含义，这样对于笔记学习其实是个负面影响。在让AI能真正自我总结前，人类的介入强化学习是不可避免的。

一句话，AI产品的突围，等待一个大模型交互等待百花齐放的时刻！

参考资料

[1]

https://karpathy.github.io/2021/06/21/blockchain/

[2]

https://notebooklm.google.com/notebook/ba017fec-7068-4085-9712-0d3207622697/audio

[3]

https://github.com/karpathy/llm.c/blob/master/train_gpt2.c

[4]

https://notebooklm.google.com/notebook/2585c187-b059-475a-b4fb-dd09d0278e18/audio

本文使用 Notion Nice 排版一键生成

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～谢谢你看我的文章，我们，下次再见。

点击关注和转发公众号保持你对AI优质内容的敏感

AI趋势全天候

以AI之名，探索未知。 🧠观察行业，关照本心，时常好奇，时常喜欢猫。随缘私信交流

生成式AI视频简史、世界模型与艺术的联结：Runway联创Anastasis Germanidis演讲编译

OpenAI 的产品管理与人工智能的未来: Kevin Weil访谈

马斯克的载入历史的一周：自动驾驶与太空探索的关键进展

HeyGen CEO 万字访谈 | TikTok 的生成式 AI 困境、语音克隆的挑战以及交互式虚拟人的未来

“我们基本上不做大语言模型了，转向人类级别的 AI” | Yann LeCun的思考

从 SaaS 到智能体：IQ+EQ+AQ三商加成下AI将发生角色转换 | 微软CEO舒尔曼观点

ChatGPT是闪电捕手，后续押注产品持久性和用户信任 | OpenAI投资人郭士纳观点

10月AI报告 | AIR STREET CAPITAL 2024全球AI发展现状十大要点（附212页报告链接）

Cursor二号位00后工程师揭秘内部团队：放弃大学期末考，只为加入AI创业

【AI从业必读】Anthropic CEO长文预判AI未来--强大的人工智能的基本假设和框架（6个特性）

NotebookLM产品经理Raiza Martin揭秘背后故事 | Google Labs AI高级产品经理专访

红杉报告 | 生成式AI的o1篇章：智能推理新时代的开启【译】

上传日记让NotebookLM秒变AI陪伴应用

10/10 Tesla We Robot会前展望：三款新车预测引发行业热议

冷知识 | 视频画质下降的真相——技术发展与平台利益对弈

Steven Johnson专访：预见NotebookLM下一步将开发视频生成

创业不疯魔，等于白忙活 | 从0到40亿美元估值：Scale创始人Wang的"过度"哲学

大A和生成式AI的异同

“Fast is Fun” Cursor创始团队看到了编程的未来图景

谷歌NotebookLM起飞！背后团队讲述“小灵快”AI产品故事

【BOS万字专访】AI眼镜要替代手机？别让科技把你玩成傻子！—Meta CTO解惑+祛魅，畅谈AI、AR、脑机接口

推理时间计算和AGI之路 - 对话OpenAI研究人员 | Sequoia Capital访谈

ChatGPT高级语音免费推送所有注册用户，亲测！ | OpenAI's DevDay 2024福利

9月：AI 圈的乌龙、趣事与新闻

AI狂欢中的人性枷锁：OpenAI上演现实版月亮与六便士

Andrej Karpathy灼见：Google NotebookLM或引领LLM交互的下一个ChatGPT时刻

OpenAI CTO 离职，Sora 前景不明

国内用不了，为什么我要了解 OpenAI 4o高级语音（类人精）正式推向市场？

Sam Altman雄文自诩“点灯人”，预告《智能时代》到来

认知GPS：LinkedIn创始人眼中AI的心灵蒸汽机时刻 | 斯坦福演讲万字分享（上）

认知GPS：LinkedIn创始人眼中AI的心灵蒸汽机时刻（下）| 含Lin师傅思考笔记

大师的灵魂拷问：手机与注意力 | 它死机后未能恢复，我过去三年的记忆随之离开

从万年灰T恤到多元风格：扎克伯格的“换装”与 Meta AI 进击之路 | 最新 Acquired访谈

T-Mobile 联手 OpenAI：75% 电话咨询将被 AI 取代，意图驱动客户体验大升级！【译】

利用社交阵地，爆点话题驱动的AI轻咨询app | 一波流搞钱大法

机器人想统治世界？其实是你想让它帮你洗衣服！

世界模型在机器人技术革新中的关键作用 | 附1X公司超100小时训练矢量视频

思考8秒后，o1还是选择 “F**K”！ | 今早OpenAI推理模型使用加速放宽，释放了想象力？

参加完 OpenAI 的活动，我看到了「草莓」的隐患

OpenAI o1的宏大叙事与 AlphaGo的第37手

「草莓」实测：可能只是工程 Trick，且有扣费陷阱！

天选打工人用本周最强AI中文辣评给职场热梗造句

乔布斯的创新苹果，如今只剩核？探讨iPhone 16的3%创新困境

AILin笔记 | 李楠AI 硬件创业取舍之道：从 Meta Glasses 和端侧模型看未来趋势

Human Intelligence & AI 转移认知时刻 | Lin师傅周末听悟

释放大模型潜力：掌握提示词工程的艺术 | 9月Anthropic圆桌深度解析

奥特曼疯了吗，真把AGI当摇钱树？| ChatGPT的订阅月费能否将涨100倍，得看OOMs

小孩哥8岁零编程经验开发游戏/网站的真相是什么？| 赛博一代的成长公式

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉