朱啸虎,金沙江创投主管合伙人。近10年最成功的VC之一,投资孵化出众多独角兽企业,包括滴滴、饿了么、小红书等知名品牌。其投资风格快速果断、雷厉风行,被业内称为“独角兽猎手”。2011年投资饿了么,用500多万美元获得几十倍回报;2012年投资滴滴,用700万美元获得1000多倍回报。
针对当下最热的AIGC,朱啸虎的观点一贯清晰而明确——回归商业逻辑。下面的内容出自他在星地AI应用孵化器开营仪式的主题演讲。演讲中,他做出了许多反直觉、非共识的判断。比如:
微信应该是将来最适合GPT的平台。
长文本是一种比较容易实现的市场营销手段。长文本所面临的问题不是技术上难以实现,而是高昂的推理成本。
现在,技术迭代的速度非常之快。对于创业者而言,研究底层技术的风险很高,产出很低。
使用开源的垂直模型不仅是出于成本低的优势,更重要的是能够保证数据安全性。
AI时代中最正确的C端产品形态尚未出现。可能需要等到每部iPhone或智能手机内置数个大模型,才能真正引发C端应用的爆发。
对应用层公司来说,这标志着ToB应用层的蓬勃发展阶段已经来临。我们常说,“钝刀”能更好地测试出市场的潜力。
“钝刀”能真正测试出PMF(Product-Market-Fit),即你的产品是否真正抓住了用户和市场的痛点。
对于创业公司而言,聚焦于垂直应用是建立竞争壁垒和市场优势的关键。
通过精确定位和深耕细分市场,可以有效地构建自己的核心竞争力,从而在激烈的市场竞争中占据有利位置。
引入AIGC后,一旦AIGC技术能为客户创造十倍以上的价值时,这些软件公司的发展速度将迅速提升。
生成式AI能够在客户服务、营销和销售、软件工程及产品研发等领域实现迅速突破。
整理|杨雪涵
AIGC将是未来10年的长坡厚雪
继ChatGPT问世以来,日新月异,新技术层出不穷。回顾过去二十年,我们见证了十年的PC互联网时代与十年的移动互联网时代。而未来十年里AIGC应用将是大势所趋,且至少有10年以上的长坡厚雪赛道。
过去20年里的发展始于硬件和基础设施,随后应用层开始反超,并创造了至少10倍以上的价值。以2000年为例,思科(Cisco)股价一度飙升至历史新高,成为当时全球最有价值的公司,而后被亚马逊、谷歌、Facebook迅速反超。AIGC的发展现状正与当年相似,尽管现在英伟达表现强劲,但长远来看,聚焦于AIGC应用层的公司必然会创造出比英伟达高出多个数量级的价值。
从创业者实际操作层面看,尽管美国一直在向前卷AGI,但目前GPT-4足以满足绝大部分文字类需求。部分创业者采用Llama 2进行训练,并在营销端和电话中心等领域实现了30%到50%的人力替代(具体比例取决于垂直优化的程度)。相较之下,利用GPT-4进行训练则可替代至少80%到90%的人力。并且在相同区间中,GPT-4的优化程度更高。
虽然继续推进技术发展仍有潜力,但投入产出比已经不成正比了。即便卷出万亿模型,产出效率也相当低。姑且不论需要投入30万张显卡,电费和推理成本也极为昂贵。再往前卷,投入产出比不高。
在实际应用中,GPT-4似乎也已达到了一个相对平缓的高坡。对应用层公司来说,这标志着ToB应用层的蓬勃发展阶段已经来临。我们常说,“钝刀”能更好地测试出市场的潜力。如果使用Llama 2都能在市场上砍价开路,那么使用GPT-4的效果可能更加显著。“钝刀”能真正测试出PMF(Product-Market-Fit),即你的产品是否真正抓住了用户和市场的痛点。因此,完全不必担心或焦虑中国的AI大模型赶不上美国,或是比美国落后一到两年的时间。
当然,今年最值得期待的无疑是GPT-4.5或GPT-5,以及Llama 3(注:Llama 3已于朱啸虎研究之后不久发布)。这两个产品将对整个业态产生重大影响。GPT-4.5或GPT-5将在哪些方面实现突破?是继续在创新思路上有所突破,还是开始向横向拓展和多模态发展?目前看来,OpenAI主要在多模态方向进行横向拓展。在深度上,OpenAI能够取得的进展相对有限,因此现在,创业者应当充分考虑如何抓住这波应用层浪潮的机会。
C端杀手级应用依然还在早期
尽管近期如GPT助手和聊天机器人等C端应用在国内外市场上异常火爆,但AI时代中最正确的C端产品形态尚未出现。
从PC互联网到移动互联网的演变,从搜索引擎到大数据推荐的转变,目的都是为了让用户更加“傻瓜化”。然而,AI时代对用户的要求更高——只有提出好问题,才能获得更有价值的答案。如何问好问题、写一个好的prompt,对于普通C端用户而言,要求过高。因此,目前出现的C端应用必然不是一个非常正确的AI产品形态。Character AI和GPT类应用都不是。作为AI时代唯二的用户过亿产品,与如Facebook、Instagram和YouTube等月活两亿左右的产品相比,有着至少五倍的差距。
从图上来看,ChatGPT呈现出了一个相对健康的增长形态。我曾在朋友圈开玩笑说,微信应该是将来最适合GPT的平台。微信和Message等聊天类应用偏向于对话且使用频率高。将GPT助手整合进这些应用后,用户可以直接在微信中提问,无需切换到其他应用中。这无疑会极大提升消费者体验。
最近,长文本很火。长文本是一种比较容易实现的市场营销手段。真正会有多少人需要利用机器人来阅读一本《三体》,据OpenAI统计,99%的用户需求在二十万token以下,超过20万token的真实需求是非常少的,都是测试需求。不可能每个人每天都需要一个机器帮你读本书。
长文本所面临的问题不是技术上难以实现,而是高昂的推理成本。例如,利用机器阅读一本《三体》可能需要花费高达2万人民币的推理成本。在没有实习商业化闭环的情况下,每位用户阅读一本《三体》也要花100块钱,成本实在太高昂。好消息是Google最近推出了一项针对Transformer技术的重大改进,能够以更低的成本和更高的效率处理长文本token。
现在,技术迭代的速度非常之快。对于创业者而言,研究底层技术的风险很高,产出很低。这一点在Character.AI的案例中表现得尤为明显。Character.AI的付费转化率极低,日活也不理想。在它的用户群中,真正愿意每天长时间与机器人聊天的人数非常有限。做类似于Character.AI虚拟交友的前八名应用中,有六个并不限制谈话内容因此难以确保对话的质量和安全。当前市场上利用AI应用讨论健康内容的需求非常少。在商业模式上,Character.AI这类技术是不可持续的。
当下,C端应用稍显稀缺。可能需要等到每部iPhone或智能手机内置数个大模型,才能真正引发C端应用的爆发。这一现象与iPhone的发展历程颇为相似。尽管iPhone 1和iPhone 2很惊艳,但直到iPhone 3引入多点触控技术后才真正出现全球性爆款应用。在已有多点触控技术的前提下,愤怒的小鸟和切水果等游戏应用才得以出现。同理,我特别期待今年下半年iPhone融入Gemini后会推出哪些应用。这其中存在着很多供创业者思考的创新点。
从短期来看,Midjourney很成功。一家仅几十人的公司年收入已达两三亿美元,但这同样不是一个可持续的商业模式。因为C端应用如文生图是低频应用,Midjourney的技术虽已多次迭代且颇为惊艳,但仍存在细节上的小瑕疵,因此这使Midjourney仅被视为一种娱乐工具,难以实现真正的商业化。相比之下,Leonardo专注于B端场景,完全为了动漫游戏等B端场景进行专门地优化,以保证交付质量能达到商业化标准。
如今,确保产品交付质量尤为重要。因为大模型本身容易出现幻觉,如何通过垂直优化来保证交付质量,确保无瑕疵,远比技术层面的酷炫要重要得多。
任何一个新技术初次出现,会首先在B端场景。大哥大和PC电脑初期均以高昂的价格首先采用在商业场景中。在我大学时期,Intel i486价值数万元,只有硕士生和博士生才可以用,但今天Intel芯片已经迭代了许多代,PC电脑也如王谢堂前燕。B端应用已经处于蓬勃发展阶段了。
生成式AI在B端企业关键职能中释放巨大潜力
麦肯锡预计在企业16个业务功能中,生成式AI能带来2.6万亿至4.4万亿美元的经济效益总价值。这一预估可能还低估了其实际潜力。根据PC销量和Office用户数推算,全球大约有10亿白领工作者,假设每位白领的人均产值为4万美元,则全球白领总产值约为40万亿美元。若能通过AIGC技术提高20%的工作效率,则能够增加8万亿美元的总产值。
AIGC提高20%效率是近期就可以很容易实现的。现在使用像Llama 2这样的高水平大模型,根据垂直调优水平的不同,至少可以提高20%至50%的工作效率。这并不是因为大模型本身极其聪明,而是因为大部分员工在日常工作中的投入程度并不高,努力程度也远远不够。
如今Llama 2能够提高20%至50%的工作效率,而采用GPT-4则能实现更高的效率提升。在B端,AI创造价值的潜力是无穷的,尤其是在客户运营、销售营销、产品研发和软件工程等领域表现得最为典型。近日,一家位于美国的软件工程公司被爆出一则丑闻。这家公司宣称开发了一种自动编程技术,并成功吸引了大量投资。然而,事实证明,其所谓的自动编程技术是假的。但即便如此,利用AIGC进行编程的潜力仍存在很大空间,大概能够提升接近30%至50%的效率。GPT-4则可将效率提高至80%至90%,即使需要花费额外的时间进行debug,仍然是划算的。
从长远角度看,生成式AI能够在客户服务、营销和销售、软件工程及产品研发等领域实现迅速突破。
AI赋能企业内部降本增效,效果立竿见影
Klarna是一家瑞典的金融和支付公司,经常需要处理客户退款/退货/订单取消等问题。该公司使用GPT开发了一个24小时在线、能处理35种语言的AI助手。上线的前四周,它处理了大约66%的客户支持工作——约230万次聊天,相当于700名全职客服的工作量;且问题解决速度快了7倍,重复咨询减少了25%。据估计,该公司因此每年增加了4000万美元的利润。
国内也有类似的案例。一家拥有1000名微信营销人员的公司,在使用Llama 2进行为期三个月的训练后,减少了一半的人力,同时大幅提升了公司利润。如果将Llama 2换为GPT-4,可能取代至少800-900人。大模型应用,对于企业来说是非常显著的利润提升工具。
今年无论是中国还是美国,大模型公司的数量都会急剧收敛。中国目前有200多家大模型公司。显然是过剩的。
我今天上午看到一位创业者分享他们基于GPT-4开发的应用,这些应用在无需修改代码或提示词的情况下便可无缝迁移到Claude 3上。这是非常惊人的。未来大模型可能会像更换电信运营商那样简便、轻松。
未来的竞争将集中在谁能够提供更低成本的服务上。许多创业者,尤其是国外的创业者,对于一般问题,他们会选择最便宜的API;对于比较难的问题,为了保证用户体验,可能采用如GPT-4这样的高端API。以后大模型将会像电信运营商那样逐渐变成基础设施服务,未来可能不再需要那么多大模型公司。大模型服务可能会像云服务一样,成为云厂商提供的基础设施服务的一部分。
开源模型好用、成本低且能保证数据安全
开源模型对于中国创业者尤为重要。我们也对即将发布的Grok 1.5和Llama 3的开源程度以及对中国创业者可能带来的积极作用充满期待。开源AI必然会如火如荼,并将持续蓬勃发展。
对于大多数应用而言,没有必要调用那些庞大模型,因为成本高昂,API使用价格不菲。相反,训练一个千亿级的垂直小模型成本相对较低,仅有几张卡便可。
在垂直应用场景中,开源的小模型便足以满足需求,尤其对于国内创业者来说更为安全。大模型公司如果没有获取到你的数据,它在竞争中便很难超越你。以我们投资的一家AI视频面试公司为例,该公司使用Llama 2进行训练。大厂对此很感兴趣,但他们无法获取这些数据。去年该公司面试了100万人次,今年预计将达到200万到300万人次。每次面试持续30至40分钟,期间收集的人机交互数据极具价值。如果使用大厂的大模型进行训练,他们便能触达到这些数据,追踪和超越你就变得相对容易。
因此,使用开源的垂直模型不仅是出于成本低的优势,更重要的是能够保证数据安全性。
AIGC创业者必须聚焦垂直应用,场景优先,数据为王
对于创业公司而言,聚焦于垂直应用是建立竞争壁垒和市场优势的关键。创业公司首先需要实现数据闭环,通过持续调优,以在其中创造机会。
现在所有国内大模型公司都想要实现双轮驱动及应用落地。大厂虽然在技术上存在优势,但对于商业场景的理解,是比不过在垂直场景深耕的AIGC创业者的。
作为创业者,应明确自身优势至关重要。你需要清楚自己在哪些垂直领域、或是用户理解和数据处理上具有竞争力。通过精确定位和深耕细分市场,可以有效地构建自己的核心竞争力,从而在激烈的市场竞争中占据有利位置。
可控,达到商业化质量远比追求高炫的技术重要
对于创业公司来说,销售能力至关重要。无论在中国还是美国,如何有效地进入市场(Go-to-Market)是许多创业者面临的共同挑战。大部分创业者都不知道如何能更高效地进入市场,如何获取B端用户。
Sora等AI视频生成工具确实很酷炫,但在细节处理上存在诸多问题。因此Sora无法转变为商业化应用。中国乃至全世界的所有广告内容都要求100%的精确度,要在保证背景酷炫的前提下,不能出现任何与实际情况不符的地方。这就要求产品描述需要完全准确,这其中便蕴藏着许多机会,且中国在这一方面具备明显的数据优势。
无论是亚马逊还是Shopify,美国的电商平台仍主要依赖图片进行商品展示。而在过去三年里,国内电商行业已基本完成了从图片向短视频的转型。国内产品视频数据尤其丰富,去年做产品广告的效果相当好,并且商业化程度也很高。我们投资的一家企业,年收入从前年的1000多万人民币增长到去年的近6000万,今年预计将达到2亿人民币。除了中国,现在日本、韩国、美国和欧洲都有相似的案例。尽管Sora很厉害,但中国的商业化输出能力要比美国更领先。美国追求技术领先,如直接利用AIGC生成电影。相比之下,中国更加注重商业化和市场的可落地。
去年我们的合资公司决定首先聚焦国内市场,先圈住国内的品牌客户。目前韩国电商正处于从图片向短视频的转型初期,因此对短视频内容的需求极大。在韩国制作一个短视频的成本远高于中国。我们在国内能够以2000人民币的价格出售一个AI视频广告,而在韩国,同样的视频可以卖到2000美元。到了美国市场,价格甚至飙升至1万美元。因此,尽管成本完全相同,出海利润率显然更高。
过去几年,国内投资人对国内软件公司的表现很失望,因为这些公司的销售增长速度远不及美国。在美国,软件公司的市场增长速度极快,年收入能够以每年两倍或三倍的速度迅速翻番,实现每年1亿美元的年收入。相比之下,中国的软件公司在达到几千万人民币的年收入后,增长速度便开始放缓,若能达到每年50%的增长已算不错。但我发现引入AIGC后,一旦AIGC技术能为客户创造十倍以上的价值时,这些软件公司的发展速度将迅速提升。
FancyTech的例子也是相通的。以前国内制作一段高质量的视频广告需要至少1万到2万人民币的成本,而现在通过应用AIGC,成本降至2000元,仅为原来的十分之一,但效果更加炫目、引人注目,极大加快了公司的发展速度。
AI视频面试步入L5时代,将在未来两三年内成为校招主流
AI视频面试也正体现出类似的技术进步。AI视频面试并不是新生事物,美国HireVue公司成立于2017年左右,最初利用自然语言处理(NLP)技术进行面试,但其智能水平相当于自动驾驶的L3级别,功能仅局限于根据预设问题进行提问并自动总结打分。随着大模型技术的应用,AI面试的能力已提升至类似自动驾驶的L5级别,能够根据应聘者的简历智能提问,并根据应聘者所回答的内容自动追问,实现了高度自动化和智能化。
过去AI面试的问题都是预设好的,因此面试过的应聘者会将问题分享到小红书上,后续的应聘者则可能通过查找这些分享的问题来提前准备,从而获得不正当的优势。然而,随着面试技术的进步,现在的AI面试已经能够实现高度个性化,形成“千人千问”的模式。这使得提前准备具体问题变得无效,从而保障了面试的公正性。
由于这种技术的成熟和可靠性,AI面试已开始大规模应用。仅过去一年就面试了100万人次,今年第一季度的面试次数已接近50万人次。预计今年全年的面试次数将达到200万至300万人次。鉴于这种趋势,预计在未来两到三年内,大部分校招都将转向AI面试,这或将改变传统招聘的流程和方法。
抓住用户痛点实现数量级价值价值
无论是5G还是2G通话,功能上看似没有太大差别。但5G AIGC营销电话有望完全颠覆中国每年约500亿人民币市场规模的传统电话营销市场。
今年国内运营商正在大力推广5G视频通话技术。与传统的2G电话相比,接通一个5G视频通话就像是开启了一个虚拟直播。如果涉及到明星代言,还可以在通话中加入明星视频。此外,国内运营商还在推广一种名为虚拟名片的功能,在接起电话前便能看到呼叫人的动画,例如网易、腾讯甚至是明星本人。这将大大提升接通率和通话效果,且成本几乎一样,只是略高一到两块钱。
但在美国无法实现上述通话效果。因为iPhone占据了高达80%的市场份额,且C端主要通过FaceTime进行视频通话。国内运营商强迫所有通话支持C2C的视频通话,但苹果仍在坚持。我预计今年下半年苹果iPhone也将开始支持这一功能,目前这一功能仅适用于安卓手机。
这种基于5G的AI视频营销电话将开辟了一个全新的庞大市场。今年春节期间已出现多位明星视频拜年电话的实例。因此关键是紧抓用户痛点,从而实现一个数量级的价值提升。相较以前,这种技术的推广显著提升销售速度及市场进入策略。我们期待看到国内创业者能够在AI技术应用上继续探索和创新。
推荐阅读
朱啸虎看完15个AI项目,留下了这些你不能不看的金句
【万字解读】创业一年就套现,杨植麟的“技术理想主义”是真的吗?