前天晚上受邀,我做了一次直播对谈 in MacTalk视频号(池建强老师的墨问西东平台),主题是「聊聊前半年看到的有趣的 AI 产品」。其中有很多产品案例,一直有观众在问,具体是哪个产品名称,今天汇总分享下(平时散落在每天的AI日报里)1、动态漫画(《猫女探索宇宙》,日本网友创作的40秒视频),我第一眼看到时,真的惊到了——2、教师根据学生的梦想(想当军人、消防员、医生、球员、企业家等等),使用AI生成“未来的你”的照片,激励学生(1分47秒视频)强烈推荐大家看下这个视频!每个孩子,看到照片前期待的眼神、看到照片后的那种开心、以及小伙伴们的欢呼……没有什么比这个更美好的了。AI一定不仅是为了降本增效,AI还可以带来人心的力量、引领和启迪。视频里,所有这一切,都是来源于那位“老师”对学生们的爱。这是源头。问一:这半年 AI 相关的产品,已经逐步在爆发了,可以聊聊你看到了什么样的趋势吗?我个人是感觉,有3个层面的趋势,咱们从外往内,一层层说——1、表面趋势:脉冲式的小爆款AI产品,时不时出现。比如最开始的妙鸭相机、哄哄模拟器、决战拜年之巅,到近期的粘土特效、已故亲人的照片生成/合影等等- 成功原因:“用户已知需求的映射、效果确实在线(80分)、加上AI噱头”三者叠加- 不持久原因:需求点本身是低频或非刚需,噱头价值衰减(媒体逐步脱敏、觉得习惯了)2、深层趋势:AI产品方法论相关的认知,开始形成部分共识(开始收敛了)比如 1) 不能简单累加AI功能,必须把账算清楚(ROI跑正)- 2019年8月14日、5年前,首发于“AI产品经理大本营”- 2022年3月9日、2年前,发布于公众号hanniman,然后有产品负责人的AI同行,单独微信说——- 产品经理设计好产品体验后,其实最多只有90分,并没完。- 用户拿到产品后,还需要完成“个性化”的设置过程,补齐最后的10分。类比来说,我们买宠物,会先选择大的类别,比如狗或猫,然后选择“子品类”(边牧?柯基?拉布拉多?),最后选择“个体”,具体是这一窝小狗中的哪一只。当把宠物带回家后,我们会给ta起个名字,并通过多次交互,让宠物逐步认识家中的各位成员——这些,都和AI的初始化是极为类似的。后续,还会逐渐教会它去熟悉家中环境,知道哪里能去/哪里不能去等。“由用户来完成AI产品设计的最后一公里”,意思是用户自己攒一个“趁手”的工具。就是说,在使用AI产品过程中,由用户来定义最终的使用场景、逐渐将产品中的一些不明确/清晰的体验特性feature/数据给明确掉、并逐渐调整自己的预期。举例的话,曾经有篇文章,提到有个“国际AI即兴剧团”,在这个剧团里,人和AI一起工作,在表演中,AI不停抛出可能需要的提示和台词,供演出者参考。也就是说,并不是由AI来直接设计台词,而是抛出无穷无尽的创意和联想、辅助人类喜剧演员的演出,。
比如 3)AIGC的核心指标,不是节省了多少时间/人力(效率属性),而是提高了多少“转化率”(利润属性)。
- 详见《深度 | 关于AIGC商业化的13个非共识认知(8000字长文)》
3、底层趋势(问题):LLM智能程度,陷入瓶颈期,但是不影响根据自己的想法、手搓AI产品,开始跑MVP
私下不少人感觉,GPT-5可能发不出来,进而导致6~18个月内,AI出现小低潮
问二:AI Agent 在前半年被提及的次数也比较多。你怎么理解 AI Agent,这块有看到什么样的好产品吗?1、Agent是个筐,什么都可以往里面装……(之前叫AI助理、语音助手……)2、记得有篇文章提到,Agent起源于拉丁语中的Agere,意思是“to do”。LLM语境下,Agent可理解为在某种能自主理解、规划决策、执行复杂任务的智能体。按照这种定位来说,目前好像没有特别好、真正跨过那条“金线”的Agent产品。- 深层看,还缺少机器和机器(Agent之间)通信和交互的底层架构和机制。比如7月21日的AI日报中,就介绍了《AI搜索新方向:第一个针对 AI Agent 构建的搜索引擎—— Exa AI》,里面提到一句话,叫做“人类不需要新搜索,但AI需要”。内部的产品负责人,外部的共创人,两者都需要具备极深度的AI产品认知能力,才有“可能”去捅破这层窗户纸。5、可能的突破口
1)短期:LLM+"RPA",可能是短期落地的最佳姿势,“部分”实现生产力价值。详见《我的12个「2024 AI 猜想」》第1点。
RPA,即机器人流程自动化(Robotic Process Automation)
- 通过模拟鼠标、键盘、触屏等操作,自动完成人的各种软件操作动作。
- 也就是说,可以把我们日常的重复性动作,交给机器人来执行,节省时间。
(AI)只模拟感知能力,对劳动力的释放是极其有限的,经济效益价值也就极其有限(算不过账来)。所以可从虚实两方面入手
- 实:LLM+机器人(机械臂、自动驾驶、无人机)等能动的硬件载体。
- 虚:LLM+RPA
这里可以引出一个最近的产品案例,阿里最新推出的Mobile-Agent-V2:具有视觉感知功能的自主多模态移动设备代理。
这个官方解释太技术了。。意思是,能理解输入的一长句话,AI自己识别手机屏幕内各种元素和按钮,然后执行操作!视频非常值得一看——
2)长期:关于Agent:目前主流的“单体智能”思路有隐患,可能的突破口是“多体智能”
类似复杂系统/鸟群,单个智能体可能很简单(不一定要超过单个人类),但整体有非凡的智慧(AI Agent 团队 >人类团队)。详见星球文章《开眼:复杂科学可能将暗中推动AI 2.0时代》(https://t.zsxq.com/118AIpLpk )问三:AI 搜索呢?我最近也在深度使用秘塔 AI 搜索。你感觉 AI 搜索会是一个怎么用的赛道?1、秘塔搜索,我也觉得很好用。(当然,后来很多同类产品都在互相借鉴)其中一个典型场景,是生活百科类的问题。- 因为常规文章,总会有所偏颇(有作者自己的动机诉求)或知识缺失,导致故意不说或不知道某些内容。- 但AI搜索,能把一个问题各方面的优劣势都展示出来,看完后,我就知道该如何选择“适合自己”的方案了。- 比如下面这个问题“穿袜子睡觉,到底好不好”?虽然前面那些好处道理,我都认可,但只一条“觉得不舒服”,那这个没办法,一票否决式的因素,那就不穿。(而有人有时喜欢穿袜子睡觉,也是ok的)2、但是,毕竟目前还没有真正全民普及(还只是高知人群、AI/互联网从业者为主),说明有问题。- 背后原因,还是互联网搜索、手机上的触屏交互,已经能解决80%的头部高频需求场景了。用户习惯已经建立了,除非是——- 面向AI原住民(至少是“10后”)的新产品形态,比如虚拟人、语音交互等等- 我更看重的是,还是前面提到的,机器和机器的交互( To AI的搜索)。比如未来人不需要主动搜索,都是AI Agent主动来交互。问四:a16z 把语音 AI 作为一个独立投资主题。你对 AI 语言方向的产品有做过研究吗?这个方向可能诞生哪些想象力的产品?2012年夏天,我们就开始做AI语音助手,完整经历了AI 1.0时代的那一波产品探索,所以对这个方向,算是有些经验和认知积累的。除了当时很火的郭德纲说英文、霉霉说中文的视频,我在社群里,还分享过很多这个角度的案例——1)先说一个2B方面的,情况是这样,那些出海公司每到一个国家地区,就需要了解当地各种法律法规条文,有巨大的时间成本。那有家AI公司,就专门提供“快速将当地法律法规情况翻译、整理成母语”的服务。从产品视角看, 非常清晰、讲得通。(详见 https://t.zsxq.com/WV7dw )2)2C方面,Spotify也推出AI语音翻译功能,“让你喜欢的播主用你的母语为你播报”——已经点出了本质:内容或IP价值是才是前提,不是任何一个小白都能把ROI跑正的。3)我最想提的,还有AirChat(投资人纳瓦尔亲自参与的),一款所谓AI Native的社交产品。类似异步版的Clubhouse,用户创建私有或公开房间后,能用语音展开交流。- 令人眼前一亮的是,基于LLM,用户发布语音之后,不仅可自动生成文本,并且还能根据用户选择的语言,模仿用户自己的音色,自动完成语音翻译。即,用户可以畅快地用母语和其他国家的人交流了!——这里面有很大的想想空间- 这背后更底层的产品方法论认知是,我认为,AI的核定差异化增量价值,就应该是之前所谓的长尾、小众场景和群体!- 日本地铁站使用“即时翻译屏幕”(https://t.zsxq.com/13XSklFTY )- 自动翻译菜单APP(https://t.zsxq.com/13Bh381k1 )- 将(动漫)图片上的文字自动翻译工具(https://t.zsxq.com/13aAmOyYE )- 沉浸式网页阅读翻译工具(https://t.zsxq.com/134xcFXZN )(背后认知:双语浏览,是最近一年非常落地的一个典型场景,虽然不太讨巧、媒体没那么激动)- 将YouTube视频翻译配音成多种语言、并支持下载的工具(https://t.zsxq.com/134qIE9Pq )用户习惯是很大瓶颈,这种代际改变,往往需要一个时代——“语音交互”能真正大范围落地,很可能还是需要等“AI原住民(至少10后)成年”。
问五:聊聊你看到的其他一些有趣的产品?
1、“外语学习+AI”方向,最近有不少有趣案例
1)马大哈翻译(刻意漏翻部分词)(详见4月27号的AI日报,https://t.zsxq.com/eLsfa )
- 引导大脑猜测“中文里夹杂的英语单词”,好玩的同时会记住更多单词。
- 浏览中文网站时,会挑选一些词汇,转成英文单词,营造中夹英效果。
- 浏览英文网站时,把网站翻译成中文时,刻意略过一些字句(功能即将发布)。
2)自动翻译生词工具Relingo(详见7月20号的AI日报,https://t.zsxq.com/niu0T )- 最大的差异化功能是,可设置自己的词汇等级,就能“只”显示自己可能不懂的单词释义了(这样更方便学单词,而不是把整个句子都翻译完)- 从(百度)网盘里检索图片,在图片上面打单词标签,给用户学习- 不过出来的照片随机,而且加载时间漫长,应该允许自主选择上传图片
1)《小姐姐给异地男朋友买新衣服,这试穿方式可还行🤣》——AI试衣平替
问六:AI时代,如何不FOMO地高效获取AI行业信息?如果只说一个认知——AI信息过载?应该担心的,并不是“知道晚了”,而是摄入了“半对半错”的信息。什么意思?曾经看到有位大V讲AI的视频,时长15分钟。但是在评论区,有两个人说,这位大V“根本不懂AI”……为什么大家能够看得出来,他不懂AI呢?举个例子——假设我说“我是一个篮球迷”,我非常喜欢芝加哥公牛队,我最崇拜乔丹、罗德曼多么厉害、库克奇三分很准、“禅师”菲尔杰克逊怎么怎么牛,balabala一堆?我说了很多。问题在于,我要去证明,我是一个篮球迷,我说很喜欢公牛队、说了这么多人,但是我竟然漏了——我没有提二号人物皮蓬。如果我是一个真的球迷,怎么可能说了乔丹、罗德曼、库克奇、菲尔杰克逊,唯独没有提皮蓬?很有可能是,我并不是真的懂这个东西。类比来说,回到前面的大V讲AI的视频。为什么我们发现他有问题?因为他说的内容,可能50%还可以,但另外50%有瑕疵。一方面,他说的一些很大的行业概念,其实并没有那么好。比如“医疗+AI”,过去十年,IBM的Watson怎么样等等,业内的人都知道,是有很大的问题的。还有些领域,可能是面子工程,并没有真正的落地,但不懂的非业内人,就会拿来说事儿。更重要的是,还有一些领域,他该说反而没说。这就有问题了。比如那个大V的视频里面,他没有提智能客服——过去的十年、五年、两年,智能客服,是已经明显的(部分)效果的一个领域,它已经在落地了,已经在融入我们生活了,已经在有一些公司能够养活自己了。如果是一个真的懂行的人,他不可能不提,因为这是真正有价值的一些具体领域(只不过说起来不够fancy、有噱头、带流量)。所以说,这种半对半错的信息,才是更最可怕的。因为如果全错,你一看就知道了,也不会去受损害。而这种掺杂在一起的信息,无形之中摄入中毒了,你还不知道。如何解决?最好信息源它本身,完整经历过一个周期、AI 1.0 周期。经历过这种周期的优势,并不是他说的百分之百都是对的,而是说,他知道什么大概率是错的、是有问题的,因为当初很多的一些场景、需求点、feature,其实早一波的从业者,当初已经都想过、试过了。只不过现在大模型起来之后,又去做一遍,里面有一些坑,是可以跳过去、可以规避的。如果没有经历过的话,可能就不知道。
串场:前面这么多有趣的AI产品案例,或者信息点或认知点,除了hanniman自己原创的之外,其实很多是散落在全网各个不同时期、不同媒体的不同文章里的,所以之前会好奇,是怎么能够发掘、记住这些信息的呢?后来也是知道,其实是因为,你每天都会花2个小时,去精心出品一个AI日报,做了很多“笨功夫”,所以近期我们墨问便签,也是专门邀请hanniman来入驻,专栏名字叫做《黄钊的AI产品内参》——问七:咱们这个专栏《黄钊的AI产品内参》,已经运营15个月了,大概形式和核心价值是什么?好的,这个专栏的内容,之前在我们社群“AI产品经理大本营”内部,叫做「黄钊的AI日报」,其实已经“日更”运营了15个月,用户口碑反馈非常好(比如有很多一线的AI产品经理和互联网同行,是把它作为了自己的核心、甚至第一的AI信息源),所以我也才有底气,单独在墨问这边分享。-这里的差异化价值在于,这5个内容点,并不是简单的新闻汇总,而是站在12年AI产品经理视角,每天从20~50篇AI文章和信息中,去捕捉真正有价值的5篇,并且从原文(可能5000字)中,提炼出真正有价值的1~2000个字,并花很大的精力、重新组织逻辑层级和表达方式。-并且非常关键的,会加上我自己的“hanniman评注”(分享紧密相关的原创深度AI产品认知,以及一些行业内幕信息)。-最终,是在展示什么“what I see”,就是同样的AI文章内容,每个人看到的重点和价值,其实是不一样的。经过这样的萃取加工,表面看,已经能取代大多数的AI信息渠道、节省你的大量时间。只要你坚持1~3个月,就会发现,自己有了一些信息差,身边的人,这方面的事情都会自动来问你,感觉很奇妙——这是一位社群产品经理的真实反馈。深层看,如果你是AI领域的一线从业者,还能给你很多AI产品认知角度的灵感刺激,会“直接的”有助于你的本职工作。现在购买90元,相当于仅需1元/天,3天内无理由退款(联系墨问客服同学)。下面是订阅入口和详细介绍——注:星球“AI产品经理大本营”会员、小报童“黄钊的AI日报”用户,无需重复购买。作者:黄钊hanniman,前腾讯PM,前图灵机器人-人才战略官/AI产品经理,12年AI、15年互联网经验;垂直于AI产品经理的第一社群“AI产品经理大本营”(7年)和自媒体“hanniman”(10年);作品有《AI产品经理的实操手册》、《黄钊的AI日报》。