从 ChatGPT 出现至今,内容行业是被 AI 影响最深的领域之一。文生图、文生视频等产品不断出现,今年 9 月, Google 推出的 NotebookLM 带来了新的可能——文生播客。在看过一个又一个让人惊叹的生成内容后,我们很好奇,AI 对内容创作的改变会进行到什么程度?
这个问题,在最近的「AI 应用 100 问」访谈中,AI 互动内容创作平台 MidReal 创始人陈锴杰和我们分享了他的答案。陈锴杰毕业于杜克大学,是一位连续创业者,2023 年年底创办 MidReal——一个让人和 AI 互动创作故事的内容平台。以下是我们与陈锴杰的对话。
01 访谈正文
1. 线性资本:先介绍一下自己和 MidReal。
陈锴杰:我大学是在杜克大学学人机交互、机械工程。大二时觉得在学校里做的事情不够有挑战,选择休学开始第一次创业,做的是家庭智能机器人这个方向,兜兜转转一直在和 AI 打交道,2023 年做了现在的项目 MidReal。从第一天起,我们就把它定位为一个写故事的地方。什么是故事?可以说是小说,也可以说是一个短剧,也可以说是 Netflix 的视频,它不局限于模态。希望因为有了 AI,那些原来无法表达无法写故事的人能在这里写出最好最精彩的故事。然后大家能一起阅读消费评论分享,也就是一个社区,一个内容平台,这是我们做 MidReal 的设想。
图|MidReal 官网首页
2. 线性资本:你实际接触用户的过程中,发现他们有什么特点?
陈锴杰:我们服务的用户,可能是一个作者,可能是一个爱好者,他本来就会写作,在 MidReal 里能用更简单、更方便的方式,通过和 AI 互动把作品写出来,有点像画家用了 MidJourney。
其次,一些本来不擅长写作,但热爱写作的用户,他们会看不同的作品,或者自己的想象力很丰富,这些用户通常比较年轻,ta 可能本来写不了,借助 AI 就能开始创作。可能有点像最早抖音上能拍视频的人不一定是会拍电影的人,他们只是有一些心得想表达,用视频这种方式传达了。所以总结来说,AI 帮他们把以前做不到的事情实现了。
图|MidReal 编辑推荐
3. 线性资本:你的创业思路是怎么样的,听起来从家庭智能机器人,到 AI 小说互动平台的跳跃挺大的,另一方面,你自己过去的个人经历也挺丰富的,每次创业的初衷是什么,是怎么做决定?
陈锴杰:我觉得最后这点蛮关键的,一个人怎么决定做不同的事情。很多事情并不是连贯着发生的,我也觉得人生充满了巧合,像那种很早就决定我要一生做一个宇航员然后为之努力,是很少的情况。
我比较追求的是做一件有趣且足够大的事情。第一次创业是往这个方向上最早的探索,当时我的导师问我要不要用实验室的成果做一些 AI 领域的应用。当时我还很年轻,对做内容做 ToC、ToB 没有想很多,想的就是把手里的算法应用到具体的场景里去。
第一次的创业经历让我更知道自己喜欢什么或者不喜欢什么,比如我不喜欢 ToB 的生意,我对人的理解,想象一个人用某个产品的过程,为了这个过程给 ta 提供更好的体验,我对这个过程非常的着迷,换句话说就是喜欢做产品经理。同时我发现我很难做一个完全和技术无关的东西,比如去做纯运营或者其他,所以后来第二次创业的时候,就选择了 AI Agent 在游戏方面的应用。因为当时想做一个 C 端对人的思考的产品。后来到 MidReal,我觉得是个人偏好表现到了极致,我直接在做和内容相关的事情了。总体上是逐渐发掘自己擅长和兴趣一路走过来。
图|MidReal Story
4. 线性资本:在你之前参加的一个播客节目里,提到做 MidReal 始于做 post-train agent,加上之前创业经历的一些启发,然后确定的做 MidReal?
陈锴杰:对,当时其实有很多的考量。出发点是我们有一个很好的 agent 训练技术,能解决长程思考,比较复杂的逻辑推理问题。有很多个行业供我们选择。当时大家有提到不同的方向,讨论到最后,回到几个问题:
第一,我们自己最想做什么。
第二,做什么能让我们市场上有一个很好的定位,不被竞争对手覆盖。
最后选择了做 AI 写故事。我觉得蛮好的。直到今天,专注在让 AI 写出好故事的团队已经剩的不多了,有一段时间挺多的,但能继续在这个领域投入技术和训练的很少。我印象中,全球范围内 5 家左右。所以在这个方向上的坚持取得了比较好的效果,而且也看到了后面市场的可能性越来越大。
图|MidReal 故事生成
5. 线性资本:为什么一开始这个领域里的创业公司挺多的,后来变少了?
陈锴杰:真正能够做好的故事写作的技术团队其实并不多。很多团队一开始冲进来是因为看到基于 LLM 包一层提示词就能做一个产品,短期可以尝到一些甜头。但随着模型进步,用户会发现直接用模型也很好。
总结来说,如果没有足够好的技术实力和产品设计能力,产品上的竞争力比较弱,最后会被竞争对手覆盖。而且后期这个事情会越来越难,随着模型本身写的故事越来越好,对后训练提出的要求越来越高,大家不满足于能写一个故事出来,而是要和作家写得一样好。我们要和创作者一起实现这个目标。这就是为什么到今天,能够继续坚持做这件事的玩家越来越少。最后想做内容的团队,大家都会殊途同归到一条路,AI 生成内容,内容被消费,只是这条赛道上大家的重点不同。有的人是生成很好的视频,有的人是通过对话来做出内容,这里面我们觉得故事的价值是最大的。因为无论媒介是什么,最后还是需要一个好故事。
6. 线性资本:在有很多声音告诉你「应该做这个」、「应该做那个」的时候,你是怎么做选择的?
陈锴杰:做选择为什么会很累,因为我们在脑子里运行了各种各样的模拟推理,假设我做了这个选择,市场会有什么变化,我们自己的技术路线会有什么变化,最后能不能成功。想通过推理看自己能不能选对的路。
除了这种方式,我们当时还有一个思路,围绕技术搭建一些简单应用,这是比较快的。比如用 2-3 周就把 MidReal 的第一个版本搭好了。同时也尝试例如用它来做研报,做游戏 agent 等。尝试之后很快发现,和用户互动的时候,内容写作这块的反馈是最好的,而且真正尝试了,也就能更好的推理如果继续往这个方向走,短期目标,终局会是什么样的。有了这些信息,决策其实变容易了。
图|MidReal 故事情节
7. 线性资本:做 MidReal 的不同阶段是什么样的?
陈锴杰:第一阶段是在 Discord 里,从去年 12 月到今年的春节,Discord 里有 2 万初始用户,我们和他们互动,理解大家是怎么用产品的,很多用户反馈 Discord 不太方便。因为写作和生图不一样,生图只有一次输入一次返回或者几次返回,写作是一个你需要一直写、不断修改文本的过程,对写作者来说,Discord 并不便利。
所以在这个用户需求的推动下,我们做了 web 版本,用户有了更好的自由度,更简单的交互界面。到现在 web 版都是我们的主力领域,目前有 30 万左右的月活跃用户。从 10 月份开始往移动端转移,希望有一个更稳定的地方,同时也有很多创作者,或者创作爱好者,能很轻松的在一个地方掏出手机来创作内容。
从技术的角度,在 Discord 里包括一开始迁移到 web 的时候,技术架构都是用后训练,是一种我先从高层次做构思,再往下展开越来越细的情节的方式。后来我们发现这个方式并不好,因为用户在很多地方会想要修改写作的剧情,会不断有新的想法,不断想调整,这种从一个核心逐渐展开的方式,如果调整计算量就很大。所以在 5 月份之后,我们就开始重构到一个新的技术路线,我们跟随着用户的意图,根据 ta 的确定性来调整,ta 越确定就有越长的推理,这个方式下来,大家对故事的互动明显变多,因为互动变快、可控性也变强了。
另外一些重要的节点,例如我们最早在 ChatGPT 上做训练,到 4、5 月的时候迁移到 Llama 3 上,本来图片方面的投入不太大,后面发现用户对图片越来越有需求,就把图片训练到更好的状态。
接下来,我觉得最重要的事情就是内容,能不能在平台上帮助用户创造出很好的内容,好到你在其他任何地方都看不到。能创作小说或者电影这样内容的人是很少的,但是短视频出现之后,人的生活的很多瞬间也很精彩,可以被发展成故事或者短篇小说,它极大的丰富了创作的题材密度。因此我觉得如果这里面能产生好的内容,有好的创作者,这个生态就会不断的变大。这是我比较大的期待。
图|MidReal 故事插图
8. 线性资本:做工具也做社区,为什么不是只做一个工具?
陈锴杰:对。抖音作为一个产品是一个很好的例子,在剪映之前,加号按钮页面里有一些特效滤镜,剪辑小工具帮创作者制作内容。今天我们等于是把加号的功能变得更加强大,然后在这里也有创作者们交流。新用户进来可以直接消费内容,看到别人是怎么制作的,ta 会成为生态中的一环,只不过以 AI 为驱动力。这样的生态,各个层面的用户比例可能会很不一样,现在所有的内容平台,消费内容的人肯定是占多数,那么如果 AI 能够把创作的门槛降低,创作者的比例会提高。
相比做社区,做平台,工具还是比较小,而且要从别人的收入里再去分成,不是一个很好的生意。
图|MidReal 故事角色
9. 线性资本:听说你之前做过很多用户调研,用户画像大概是什么样的,他们的核心诉求是什么?在没有 MidReal 这个平台之前,他们用什么满足自己的写作爱好需要?
陈锴杰:用户主要是在美国,英文市场里年轻一些对写作感兴趣的人,他们最大的特点就是时间多。无论是学生还是刚工作的人,工作之余,他们会花时间看视频,阅读,此外也会想要表达和创造。
如果这些人本来没有写作习惯,那么创作这件事就是在他们生活中的脑洞,停留在想一想就过去了。其中有的人会想把它记录下来,分享给朋友,分享给社区的人,让更多的人来认可。以前是各种笔记软件创作。但是有 AI 和没有 AI,还是有本质的区别,因为写作还是挺困难的,英文里有一些辅助写作的工具,和我们的侧重点不同,有的是不想成为平台,侧重提供工具,极端一点的例子比如 Google Doc 这样工具类的产品,用户也就没有归属感,它只是工具而已。在 MidReal 里,我们花了很多心思让用户和 AI 互动,让作者天然认为这个作品是和 AI 一起完成的,发布在这里,让更多的人看到推广。
10. 线性资本:有什么印象深刻的用户故事?
陈锴杰:有一个用户,之前是学哲学的,也是一个作家,帮别人写书,写了很多书。他得了新冠之后,身体不太好不能再写作了,对文字的敏感好像突然消失了,很痛苦,也影响到了家庭生活,后面他发现 MidReal 之后重新开始写作,说生活发生了翻天覆地的变化。当时他给我们发了很长很长的邮件来感谢我们,也跟我们打视频电话,帮我们在社区里传播他和 MidReal 的互动故事,这样的用户和故事让我挺感动的。
图|MidReal 故事内容
11. 线性资本:内容平台往往会自己做一些品牌内容,给其他创作者起到一个示范作用,你们需要这么做吗?
陈锴杰:相似的地方是,作为平台要思考怎么引导好的内容出现,比如我们会思考是招募创作者做激励计划,还是做社群,自己雇一些创作者主动为我们写好故事。肯定是需要一些引导,不管是从推荐还是从和创作者互动鼓励他们。
12. 线性资本:MidReal 产品最大的亮点是互动创作,可否用 1-2 个例子以及背后的思考,说说这些互动的设置思路,和对用户的启发/帮助,产品如何更好的理解用户需要什么,同时能符合一个好故事的脉络?
陈锴杰:我们有两个有趣的设置,一开始 MidReal 是模型写一段,用户在那一段后面做选择,或者写入自己的选择来让故事继续发展。但我们很快就发现,这样其实没有办法满足用户对于创作的渴望,他们很多时候会有一些设想,模型第一次并不能写好,他们还想不断微调,所以在互动这方面我们做的第一个功能,就是允许用户从任何一个句子去改写文章,故事其实是以句子为单位在切分的。每一个句子都可以点击-修改,表达接下来要改变剧情的发展方向。这个功能上线之后,收到了用户很好的评价,他们可以很自由的修改自己的作品,创作出来的内容质量也随之提高。
图|MidReal 故事分支
13. 线性资本:面向英文用户做推广,你有什么心得吗?现在很多产品在做出海,面向说英语的年轻人。
陈锴杰:大家都会说要做社群,做社区,找到精准的用户群等这些方法。我个人觉得有两点:
第一,要想你的用户本身在哪儿活动,在网络上,这些本身会写作,或有写作想法的人,他们到底在用什么东西,什么产品,去这些地方找到他们,这是个比较直接的想法。
第二,付费推广还是一个比较合适的事情。它比较稳定,你也有很多优化的空间,因为早期一直在变化和尝试、试错,如果每次都想去找一个用户群、社群,会让增长非常的慢,还是需要想办法快速验证想法是不是对的,和拿到用户反馈。
14. 线性资本:在你的尝试中有哪些投放得到比较好的增长效果?
陈锴杰:其实投放的就那几家,Facebook、TikTok 和 Google,总体都还可以,投放的核心还是要找到投放的人群和内容,然后是制作出好的内容素材——这一点对投放的成本影响可能是 3-5 倍。
15. 线性资本:MidReal 的竞争壁垒是什么?如何不被模型的更新覆盖掉?
陈锴杰:现在应用层,稍微做一点技术就是 post-train 方式,大家本质上没有太大的区别,关键的是你选的领域,就像写代码写故事,它没有上限,人可以一直创造更好的,这些任务本身也是足够复杂的。但是有一些任务,比如笔记整理,人可能不一定需要笔记整理的越来越好。
16. 线性资本:创业到现在你觉得最大的挑战是什么?创业者每天都在面对很多挑战,特别重大的也许是关键的几个,有哪些挑战对你来说属于策略上的挑战?这背后需要你做对判断东西是什么?
陈锴杰:现在最大的挑战就是怎么样做出好内容。然后因为这是一个耦合度比较高的问题。有三个东西在影响内容:我们的模型技术,产品功能,创作者的状态。这三个事情互相影响。没有产品和技术,创作者也能在纸上写出来,只是比较难,只有技术和创作者,如果产品不好,也非常难。产品要提供的能力,包括比如模型一次写不好,在产品上就要有一些能让 ta 二次修改的功能,或者能让 ta 对一些不好的地方直接一键重写,如果没有这些功能,写作也是痛苦的。也就是说,产品和模型也贴着走,要匹配,但是即便模型和产品都有,今天的时代原因,技术和 AI 还没达到的时候,对人也得有一些激发和引导,不然 ta 随便写达不到作家水平的好内容。所以这三个因素很重要,他们交织着决定我们今天的内容质量。这是我最关心的问题。
图|MidReal 小说角色对话
17. 线性资本:目前摸索了什么解决方案?或者说解决这个问题的突破口是什么?
陈锴杰:就是把这三个方面做得越来越好。解法是比较具体的,怎么找创作者,鼓励他们创作,怎么把他们创作的好的内容推荐出去,技术上怎么训练模型来解决一个个的具体问题,比如我们现在觉得排比句太多了,下一次训练怎么把排比句这个东西减少一点,增加一点描述性的语言等等。
18. 线性资本:结合以前的创业经历,你会有前 AI 时代和后 AI 时代的这种强烈对比感受吗?
陈锴杰:有,不过前面的创业经历比较短,简单的说最大的区别是团队,事情就还好。AI 时代的变化太快了,它属于全世界大量的人才在共同推进一个技术,这个技术的演化要跟上是很难的。它直接带来的改变和感受就是今天的团队工作节奏非常快。
图|MidReal Labs
19. 线性资本:你之前有提到下一步是做视频指的是什么?变成一个视频内容平台吗?
陈锴杰:现在的故事里更多是图文,下一步我们会希望能够把好的故事挑选出来,直接为它生成视频。对,把故事变成视频,像短剧一样。我们的平台上会有视频内容,希望能够有越来越多视频内容。
图|MidReal Blogs
20. 线性资本:你观察到的 AI 应用创业者,大家普遍关心什么,普遍在焦虑什么?
陈锴杰:别人其实我并不知道,普遍感受下来大家关心增长更多吧。
21. 线性资本:这两年 AI 在内容这个领域上产生的作用、影响是最大的,你认为 AI 接下来会给内容行业带来什么大的改变?
陈锴杰:毫无疑问,AI 会带来全新的内容平台,内容媒介。目前已经发生的是,本来人生产内容,现在从物种层面有了一个新的生产者,而且质量并不差。只是今天整个社会都还在适应,当我们每个人手机里 Apple Intelligence 或者其他什么智能的设备,为我们生产会议笔记,帮我给我的朋友发消息,大家的思维方式都会发生变化,内容平台上所有的内容都会发生改变。大家只是暂时不知道这个新形态的内容会以什么互动方式来呈现,人们会怎么消费,是一边互动一边消费,还是像以前一样。
与此同时,现在是大公司、小公司都在同一个起跑线上探索这个问题,我觉得也许 3-5 年之后见分晓。站在今天的角度,就像前面提到的,大家从不同的维度去探索这个问题,有的人从媒介,有的人从内容,有的人从工具,有的人从平台,如果大家都能活下来,那么 3-5 年后也许会大战一场,甚至和传统的平台也会有冲突,所以很多时候我想的就是,现在做什么样的事情能让我们在 3-5 年后的竞争中获胜。
02 更多阅读