用AI五分钟就能生成一档播客?感觉降维打击了

文摘   2024-09-19 09:09   北京  


不是,直接给一篇文章,然后用AI就能生成十几分钟的双人播客,两人有打断、有调侃、有语气,一个捧哏一个逗哽各司其职,比人聊的还好听,你敢信?
这个中秋假期,我信了,真的。
Google做的一款AI笔记应用,NotebookLM,这几天更新了一个新功能,就是根据文本,生成双人播客
他们称这个功能,为音频概览。
把一篇OpenAI上线o1的公众号文章扔进去,生成了一个播客,给你们听下效果。

这个语气,这个聊天的感觉,我人麻了。

几乎跟真人无异,在一个人说话的时候,另一个人甚至会在其中穿插一些嗯啊之类的语气反应,还会打断,附和。
最重要的是,这种形式,真的很有趣。
过往,我们已经看到了无数,使用AI帮助自己学习的例子。
比如我自己最喜欢的,把一个名词或者一句我不懂的话,扔给Claude或者ChatGPT,然后附一段我自己最喜欢的Prompt:
“我是一个六年级的小朋友,请用极度详细、通俗易懂的例子帮助我理解这部分信息。”
他会给我讲解的非常非常细致,比如,解释一下最近海外独角兽文章中的一句话:"纯靠语言的经典 scaling law 做 pre-train 的这个物理规律是不是就遇到瓶颈了?"
无敌好用,真的,在我学习路上陪伴了我N久,非常适合我这种笨比门外汉。
但是不管是解释、还是思维导图、还是各种摘要或提问,其实有一个共同点,那就是:
全部都是基于文字的。
但是这种有一个很大的问题是,并不是每个人,或者说每个时间,都是通过阅读来学习的。
很多人其实是听觉学习者,或者在一些不方便阅读的时候,使用听觉来获取信息以及学习,比如播客两个最典型的场景,其实是做家务和开车。
这两个场景,占据了相当大的时间,但是这个时候,你想阅读,是不可能的。
播客的使用量也急剧上升,不管是国内还是国外,播客也都证明了,理解一个主题的最有效方式之一,是倾听两个有趣且投入的人进行对话。
但播客的数量,就那么点,求人不如求己,被动学习不如主动学习。
所以,在此基础上,Google NotebookLM的“音频概览”应运而生。
只能说他们太懂学习了。
网址在此:https://notebooklm.google/
记得上魔法,然后登录google账号就能直接用。
进去了,先创建一个笔记本,每个笔记本你可以理解为,是一个单独的知识库。
你可以扔网址、扔文件,也可以只粘贴文字。
我把我的人物简历PDF扔进去以后,他就会自动对内容进行解析,给你弹出笔记本指南。
你可以跟知识库一样随便问随便学习,可能列出目录、时间线等等,当然,最屌的还是那个音频概览。
点一下生成,最多耗时五分钟,你就能得到一个大约十分钟的,由两个AI 主持人进行“深度探讨”的英文音频播客。
我把两人聊我简历的这段小播客,扔到飞书妙记里,给大家看一下大概的内容。
这两人聊的,真的很有趣,情绪价值拉满,中间还会针对我的经历做一些讨论,给我加一些奇奇怪怪的梗。
说实话,听到有人用很聊天的感觉,在聊我的故事,那感觉还是有点羞耻的,但是,不知不觉,这6分钟很快就听完了。。。
整体,这个效果好是好,但是在我听了十几段我把各种乱七八糟的文件、笔记、研报、文章、网站扔进去之后,我也发现了三个很大的问题。
1. 那还是语言问题,作为一个中国人,我还是喜欢听自己的母语,没有什么比中文更酷的语言了,但是现在的NotebookLM,只能生成英文,这肯定不够,11Labs还能生成29种语言呢。
2. 不支持声音克隆,就跟文本、绘图、音乐一样,一定会有人希望用这个东西去做自己的播客的,如果全世界都是现在这两人的声音,那听一听肯定就还是腻了,如果能跟11Labs一样,支持语音克隆,自定义声音,那就完美了。
3. 文本的幽默性还是不够,播客大家很多人听,也是希望能既有趣又有用,真要哐哐的在那听1小时干货,那人也麻了,所以你看为啥半拿铁订阅者那么多,是因为他们真的讲的很有趣啊。。。而NotebookLM受限于自己家的Gemini,在幽默和文本上,真的还是差Claude一大截。
不过音频概览这个功能,也仅仅只上线了几天而已,我的要求可能确实有点多,没事,问题不大,未来可期。
我也顺道,加入了他们官方的Discord群聊,把群里的聊天记录,翻到了上线前的那一天,也发现了很多有趣的使用场景。
有个叫paradroid的老哥,把Discord一天的聊天记录粘贴到NotebookLM里,每天晚上听一个简短的播客,来总结群里一天的聊天。
有天文博物馆的老哥,用他来做音频,帮助教育工作。
也有高中教师,把它当作给学生复习的音频资料。
还有数学家,用NotebookLM制作的播客,辅助自己理解论文。
等等等等。
好像有一种全新的场景,被开辟出来了。
我觉得,与其担心被AI取代,不如想想怎么利用好这些工具来提高自己。
比如说,就这个小东西,我们可以用它来:
  1. 快速消化大量信息,把长篇大论变成有趣的对话。

  2. 在做家务或者开车的时候"阅读"那些平时没时间看的文章。

  3. 练习英语听力,顺便学点新知识。

  4. 甚至可以用来准备演讲稿,听听别人(虽然是AI)怎么聊你的观点。

多个模态之间的相互流转,一定会是未来最主要的旋律。
无需抵制,大胆去用就行了。
就像黑悟空中,黄梅老儿那句经典的台词一样:
既见未来,为何不拜。
一个样。
但是,没错,但是来了。
再牛逼的AI,再有趣的场景,我觉得,也不能替代真实的人际交流。
毕竟,没有什么比和朋友面对面地聊天,一起分享观点和笑声更让人愉快的了。
所以,你要不要一起找个时间,跟你的朋友,坐下来好好聊聊天啊?
说一句:
“我请客,咱们边吃火锅边聊聊天,怎么样?”

AI技术正改变世界,而AiDD峰会正是这一变革的缩影。峰会汇聚了全球的研发精英,共同探讨和分享如何利用AI技术解决现实问题,推动社会进步。AiDD峰会即将于2024年11月8-9日于深圳举办,主题为“AI驱动研发变革,促进企业降本增效”。覆盖研发、产品、测试\质量、AI架构师、数据科学家等技术管理者,内容涵盖当下实时热点:AI Agents、大模型对齐与安全、端侧大模型与云端协同、领域大模型SFT与优化、知识增强与数据智能、AI+流程自动化、AI驱动产品及设计创新、LLM驱动编程与单测等精彩内容,聚焦于实践操作与经验共享。现AiDD峰会早鸟票火热报名中,欢迎大家扫码报名,了解更多详情!
如果在您心目中有非常合适的演讲人选,欢迎向组委会推荐(请在邮件中尽可能详述被推荐人的个人信息与可分享的话题信息,发送至assistant@aidd.vip



推荐活动




欢迎大家参与「2024软件研发应用大模型」调查,您的见解将推动行业创新,同时还有机会赢取技术图书奖励。2024年的软件研发应用大模型调查,旨在更深入地理解LLM在软件研发中的新进展、新趋势和新挑战。与2023年的调查相比,今年的调查在内容上进行了优化、丰富和扩展,增加了几项重要的调查项,例如:RAG相关技术、智能体(agents)开发框架、微调技术、业务规划或产品创新、在“软件需求” 哪些方面发挥作用、各个行业 / 领域大模型应用成熟度......。欢迎参与调研,也欢迎一起转发,让更多的企业参与。
《2023软件研发应用大模型现状调研报告》下载渠道:请关注本公众号,输入“AiDD2023调查”可免费下载。

点这里↓↓↓记得关注标星哦~





中智凯灵
中智凯灵(KeyLink)是国内领先的专业数字人才发展平台,面向科技研发型企业和组织提供数字化人才培养的专属成长地图,数字化转型的方法 + 智库。
 最新文章