AI应用100问|当人类和AI一起创作内容成为日常,全新的内容平台还会远吗?

科技   2024-10-22 18:22   北京  

从 ChatGPT 出现至今,内容行业是被 AI 影响最深的领域之一。文生图、文生视频等产品不断出现,今年 9 月, Google 推出的 NotebookLM 带来了新的可能——文生播客。在看过一个又一个让人惊叹的生成内容后,我们很好奇,AI 对内容创作的改变会进行到什么程度?

这个问题,在最近的「AI 应用 100 问」访谈中,AI 互动内容创作平台 MidReal 创始人陈锴杰和我们分享了他的答案。陈锴杰毕业于杜克大学,是一位连续创业者,2023 年年底创办 MidReal——一个让人和 AI 互动创作故事的内容平台。以下是我们与陈锴杰的对话。

01 访谈正文

1. 线性资本:先介绍一下自己和 MidReal。

陈锴杰:我大学是在杜克大学学人机交互、机械工程。大二时觉得在学校里做的事情不够有挑战,选择休学开始第一次创业,做的是家庭智能机器人这个方向,兜兜转转一直在和 AI 打交道,2023 年做了现在的项目 MidReal。从第一天起,我们就把它定位为一个写故事的地方。什么是故事?可以说是小说,也可以说是一个短剧,也可以说是 Netflix 的视频,它不局限于模态。希望因为有了 AI,那些原来无法表达无法写故事的人能在这里写出最好最精彩的故事。然后大家能一起阅读消费评论分享,也就是一个社区,一个内容平台,这是我们做 MidReal 的设想。



图|MidReal 官网首页

2. 线性资本:你实际接触用户的过程中,发现他们有什么特点?

陈锴杰:我们服务的用户,可能是一个作者,可能是一个爱好者,他本来就会写作,在 MidReal 里能用更简单、更方便的方式,通过和 AI 互动把作品写出来,有点像画家用了 MidJourney。

其次,一些本来不擅长写作,但热爱写作的用户,他们会看不同的作品,或者自己的想象力很丰富,这些用户通常比较年轻,ta 可能本来写不了,借助 AI 就能开始创作。可能有点像最早抖音上能拍视频的人不一定是会拍电影的人,他们只是有一些心得想表达,用视频这种方式传达了。所以总结来说,AI 帮他们把以前做不到的事情实现了。



图|MidReal 编辑推荐

3. 线性资本:你的创业思路是怎么样的,听起来从家庭智能机器人,到 AI 小说互动平台的跳跃挺大的,另一方面,你自己过去的个人经历也挺丰富的,每次创业的初衷是什么,是怎么做决定?

陈锴杰:我觉得最后这点蛮关键的,一个人怎么决定做不同的事情。很多事情并不是连贯着发生的,我也觉得人生充满了巧合,像那种很早就决定我要一生做一个宇航员然后为之努力,是很少的情况。

我比较追求的是做一件有趣且足够大的事情。第一次创业是往这个方向上最早的探索,当时我的导师问我要不要用实验室的成果做一些 AI 领域的应用。当时我还很年轻,对做内容做 ToC、ToB 没有想很多,想的就是把手里的算法应用到具体的场景里去。

第一次的创业经历让我更知道自己喜欢什么或者不喜欢什么,比如我不喜欢 ToB 的生意,我对人的理解,想象一个人用某个产品的过程,为了这个过程给 ta 提供更好的体验,我对这个过程非常的着迷,换句话说就是喜欢做产品经理。同时我发现我很难做一个完全和技术无关的东西,比如去做纯运营或者其他,所以后来第二次创业的时候,就选择了 AI Agent 在游戏方面的应用。因为当时想做一个 C 端对人的思考的产品。后来到 MidReal,我觉得是个人偏好表现到了极致,我直接在做和内容相关的事情了。总体上是逐渐发掘自己擅长和兴趣一路走过来



图|MidReal Story

4. 线性资本:在你之前参加的一个播客节目里,提到做 MidReal 始于做 post-train agent,加上之前创业经历的一些启发,然后确定的做 MidReal?

陈锴杰:对,当时其实有很多的考量。出发点是我们有一个很好的 agent 训练技术,能解决长程思考,比较复杂的逻辑推理问题。有很多个行业供我们选择。当时大家有提到不同的方向,讨论到最后,回到几个问题:

第一,我们自己最想做什么。

第二,做什么能让我们市场上有一个很好的定位,不被竞争对手覆盖。

最后选择了做 AI 写故事。我觉得蛮好的。直到今天,专注在让 AI 写出好故事的团队已经剩的不多了,有一段时间挺多的,但能继续在这个领域投入技术和训练的很少。我印象中,全球范围内 5 家左右。所以在这个方向上的坚持取得了比较好的效果,而且也看到了后面市场的可能性越来越大。



图|MidReal 故事生成

5. 线性资本:为什么一开始这个领域里的创业公司挺多的,后来变少了?

陈锴杰:真正能够做好的故事写作的技术团队其实并不多。很多团队一开始冲进来是因为看到基于 LLM 包一层提示词就能做一个产品,短期可以尝到一些甜头。但随着模型进步,用户会发现直接用模型也很好。

总结来说,如果没有足够好的技术实力和产品设计能力,产品上的竞争力比较弱,最后会被竞争对手覆盖。而且后期这个事情会越来越难,随着模型本身写的故事越来越好,对后训练提出的要求越来越高,大家不满足于能写一个故事出来,而是要和作家写得一样好。我们要和创作者一起实现这个目标。这就是为什么到今天,能够继续坚持做这件事的玩家越来越少。最后想做内容的团队,大家都会殊途同归到一条路,AI 生成内容,内容被消费,只是这条赛道上大家的重点不同。有的人是生成很好的视频,有的人是通过对话来做出内容,这里面我们觉得故事的价值是最大的。因为无论媒介是什么,最后还是需要一个好故事


6. 线性资本:在有很多声音告诉你「应该做这个」、「应该做那个」的时候,你是怎么做选择的?

陈锴杰:做选择为什么会很累,因为我们在脑子里运行了各种各样的模拟推理,假设我做了这个选择,市场会有什么变化,我们自己的技术路线会有什么变化,最后能不能成功。想通过推理看自己能不能选对的路。

除了这种方式,我们当时还有一个思路,围绕技术搭建一些简单应用,这是比较快的。比如用 2-3 周就把 MidReal 的第一个版本搭好了。同时也尝试例如用它来做研报,做游戏 agent 等。尝试之后很快发现,和用户互动的时候,内容写作这块的反馈是最好的,而且真正尝试了,也就能更好的推理如果继续往这个方向走,短期目标,终局会是什么样的。有了这些信息,决策其实变容易了。



图|MidReal 故事情节

7. 线性资本:做 MidReal 的不同阶段是什么样的?

陈锴杰:第一阶段是在 Discord 里,从去年 12 月到今年的春节,Discord 里有 2 万初始用户,我们和他们互动,理解大家是怎么用产品的,很多用户反馈 Discord 不太方便。因为写作和生图不一样,生图只有一次输入一次返回或者几次返回,写作是一个你需要一直写、不断修改文本的过程,对写作者来说,Discord 并不便利。

所以在这个用户需求的推动下,我们做了 web 版本,用户有了更好的自由度,更简单的交互界面。到现在 web 版都是我们的主力领域,目前有 30 万左右的月活跃用户。从 10 月份开始往移动端转移,希望有一个更稳定的地方,同时也有很多创作者,或者创作爱好者,能很轻松的在一个地方掏出手机来创作内容。

从技术的角度,在 Discord 里包括一开始迁移到 web 的时候,技术架构都是用后训练,是一种我先从高层次做构思,再往下展开越来越细的情节的方式。后来我们发现这个方式并不好,因为用户在很多地方会想要修改写作的剧情,会不断有新的想法,不断想调整,这种从一个核心逐渐展开的方式,如果调整计算量就很大。所以在 5 月份之后,我们就开始重构到一个新的技术路线,我们跟随着用户的意图,根据 ta 的确定性来调整,ta 越确定就有越长的推理,这个方式下来,大家对故事的互动明显变多,因为互动变快、可控性也变强了。

另外一些重要的节点,例如我们最早在 ChatGPT 上做训练,到 4、5 月的时候迁移到 Llama 3 上,本来图片方面的投入不太大,后面发现用户对图片越来越有需求,就把图片训练到更好的状态。

接下来,我觉得最重要的事情就是内容,能不能在平台上帮助用户创造出很好的内容,好到你在其他任何地方都看不到。能创作小说或者电影这样内容的人是很少的,但是短视频出现之后,人的生活的很多瞬间也很精彩,可以被发展成故事或者短篇小说,它极大的丰富了创作的题材密度。因此我觉得如果这里面能产生好的内容,有好的创作者,这个生态就会不断的变大。这是我比较大的期待。



图|MidReal 故事插图

8. 线性资本:做工具也做社区,为什么不是只做一个工具?

陈锴杰:对。抖音作为一个产品是一个很好的例子,在剪映之前,加号按钮页面里有一些特效滤镜,剪辑小工具帮创作者制作内容。今天我们等于是把加号的功能变得更加强大,然后在这里也有创作者们交流。新用户进来可以直接消费内容,看到别人是怎么制作的,ta 会成为生态中的一环,只不过以 AI 为驱动力。这样的生态,各个层面的用户比例可能会很不一样,现在所有的内容平台,消费内容的人肯定是占多数,那么如果 AI 能够把创作的门槛降低,创作者的比例会提高。

相比做社区,做平台,工具还是比较小,而且要从别人的收入里再去分成,不是一个很好的生意。

图|MidReal 故事角色

9. 线性资本:听说你之前做过很多用户调研,用户画像大概是什么样的,他们的核心诉求是什么?在没有 MidReal 这个平台之前,他们用什么满足自己的写作爱好需要?

陈锴杰:用户主要是在美国,英文市场里年轻一些对写作感兴趣的人,他们最大的特点就是时间多。无论是学生还是刚工作的人,工作之余,他们会花时间看视频,阅读,此外也会想要表达和创造。

如果这些人本来没有写作习惯,那么创作这件事就是在他们生活中的脑洞,停留在想一想就过去了。其中有的人会想把它记录下来,分享给朋友,分享给社区的人,让更多的人来认可。以前是各种笔记软件创作。但是有 AI 和没有 AI,还是有本质的区别,因为写作还是挺困难的,英文里有一些辅助写作的工具,和我们的侧重点不同,有的是不想成为平台,侧重提供工具,极端一点的例子比如 Google Doc 这样工具类的产品,用户也就没有归属感,它只是工具而已。在 MidReal 里,我们花了很多心思让用户和 AI 互动,让作者天然认为这个作品是和 AI 一起完成的,发布在这里,让更多的人看到推广。


10. 线性资本:有什么印象深刻的用户故事?

陈锴杰:有一个用户,之前是学哲学的,也是一个作家,帮别人写书,写了很多书。他得了新冠之后,身体不太好不能再写作了,对文字的敏感好像突然消失了,很痛苦,也影响到了家庭生活,后面他发现 MidReal 之后重新开始写作,说生活发生了翻天覆地的变化。当时他给我们发了很长很长的邮件来感谢我们,也跟我们打视频电话,帮我们在社区里传播他和 MidReal 的互动故事,这样的用户和故事让我挺感动的。



图|MidReal 故事内容

11. 线性资本:内容平台往往会自己做一些品牌内容,给其他创作者起到一个示范作用,你们需要这么做吗?

陈锴杰:相似的地方是,作为平台要思考怎么引导好的内容出现,比如我们会思考是招募创作者做激励计划,还是做社群,自己雇一些创作者主动为我们写好故事。肯定是需要一些引导,不管是从推荐还是从和创作者互动鼓励他们。


12. 线性资本:MidReal 产品最大的亮点是互动创作,可否用 1-2 个例子以及背后的思考,说说这些互动的设置思路,和对用户的启发/帮助,产品如何更好的理解用户需要什么,同时能符合一个好故事的脉络?

陈锴杰:我们有两个有趣的设置,一开始 MidReal 是模型写一段,用户在那一段后面做选择,或者写入自己的选择来让故事继续发展。但我们很快就发现,这样其实没有办法满足用户对于创作的渴望,他们很多时候会有一些设想,模型第一次并不能写好,他们还想不断微调,所以在互动这方面我们做的第一个功能,就是允许用户从任何一个句子去改写文章,故事其实是以句子为单位在切分的。每一个句子都可以点击-修改,表达接下来要改变剧情的发展方向。这个功能上线之后,收到了用户很好的评价,他们可以很自由的修改自己的作品,创作出来的内容质量也随之提高。


第二个是允许根据别人的内容进行互动和修改。今天我们在视频下面发弹幕,或者在别人的文章下面写评论,其实都是我们对这个内容有不同想法的表现。我们看一个电影,从来不会觉得这个电影是非常完美的,都会对它有一些想法和思考,那在别人写的故事里,现在 MidReal 用户也可以对任何一句话做出分支选择,比如说我觉得你的故事里面,哈利·波特就不应该和金妮在一起,应该和赫敏在一起。点那个位置,输入我想要的发展方向,就能创造一个像它分支剧情一样的故事。我在你的故事上创造一个我的分支,按照我想要的方式去发展这个故事世界。


图|MidReal 故事分支

13. 线性资本:面向英文用户做推广,你有什么心得吗?现在很多产品在做出海,面向说英语的年轻人。

陈锴杰:大家都会说要做社群,做社区,找到精准的用户群等这些方法。我个人觉得有两点:

第一,要想你的用户本身在哪儿活动,在网络上,这些本身会写作,或有写作想法的人,他们到底在用什么东西,什么产品,去这些地方找到他们,这是个比较直接的想法。

第二,付费推广还是一个比较合适的事情。它比较稳定,你也有很多优化的空间,因为早期一直在变化和尝试、试错,如果每次都想去找一个用户群、社群,会让增长非常的慢,还是需要想办法快速验证想法是不是对的,和拿到用户反馈。


14. 线性资本:在你的尝试中有哪些投放得到比较好的增长效果?

陈锴杰:其实投放的就那几家,Facebook、TikTok 和 Google,总体都还可以,投放的核心还是要找到投放的人群和内容,然后是制作出好的内容素材——这一点对投放的成本影响可能是 3-5 倍。


图|MidReal 生成的故事封面


15. 线性资本:MidReal 的竞争壁垒是什么?如何不被模型的更新覆盖掉?

陈锴杰:现在应用层,稍微做一点技术就是 post-train 方式,大家本质上没有太大的区别,关键的是你选的领域,就像写代码写故事,它没有上限,人可以一直创造更好的,这些任务本身也是足够复杂的。但是有一些任务,比如笔记整理,人可能不一定需要笔记整理的越来越好。


16. 线性资本:创业到现在你觉得最大的挑战是什么?创业者每天都在面对很多挑战,特别重大的也许是关键的几个,有哪些挑战对你来说属于策略上的挑战?这背后需要你做对判断东西是什么?

陈锴杰:现在最大的挑战就是怎么样做出好内容。然后因为这是一个耦合度比较高的问题。有三个东西在影响内容:我们的模型技术,产品功能,创作者的状态。这三个事情互相影响。没有产品和技术,创作者也能在纸上写出来,只是比较难,只有技术和创作者,如果产品不好,也非常难。产品要提供的能力,包括比如模型一次写不好,在产品上就要有一些能让 ta 二次修改的功能,或者能让 ta 对一些不好的地方直接一键重写,如果没有这些功能,写作也是痛苦的。也就是说,产品和模型也贴着走,要匹配,但是即便模型和产品都有,今天的时代原因,技术和 AI 还没达到的时候,对人也得有一些激发和引导,不然 ta 随便写达不到作家水平的好内容。所以这三个因素很重要,他们交织着决定我们今天的内容质量。这是我最关心的问题。



图|MidReal 小说角色对话

17. 线性资本:目前摸索了什么解决方案?或者说解决这个问题的突破口是什么?

陈锴杰:就是把这三个方面做得越来越好。解法是比较具体的,怎么找创作者,鼓励他们创作,怎么把他们创作的好的内容推荐出去,技术上怎么训练模型来解决一个个的具体问题,比如我们现在觉得排比句太多了,下一次训练怎么把排比句这个东西减少一点,增加一点描述性的语言等等。


18. 线性资本:结合以前的创业经历,你会有前 AI 时代和后 AI 时代的这种强烈对比感受吗?

陈锴杰:有,不过前面的创业经历比较短,简单的说最大的区别是团队,事情就还好。AI 时代的变化太快了,它属于全世界大量的人才在共同推进一个技术,这个技术的演化要跟上是很难的。它直接带来的改变和感受就是今天的团队工作节奏非常快。



图|MidReal Labs

19. 线性资本:你之前有提到下一步是做视频指的是什么?变成一个视频内容平台吗?

陈锴杰:现在的故事里更多是图文,下一步我们会希望能够把好的故事挑选出来,直接为它生成视频。对,把故事变成视频,像短剧一样。我们的平台上会有视频内容,希望能够有越来越多视频内容。



图|MidReal Blogs

20. 线性资本:你观察到的 AI 应用创业者,大家普遍关心什么,普遍在焦虑什么?

陈锴杰:别人其实我并不知道,普遍感受下来大家关心增长更多吧。




21. 线性资本:这两年 AI 在内容这个领域上产生的作用、影响是最大的,你认为 AI 接下来会给内容行业带来什么大的改变?

陈锴杰:毫无疑问,AI 会带来全新的内容平台,内容媒介目前已经发生的是,本来人生产内容,现在从物种层面有了一个新的生产者,而且质量并不差。只是今天整个社会都还在适应,当我们每个人手机里 Apple Intelligence 或者其他什么智能的设备,为我们生产会议笔记,帮我给我的朋友发消息,大家的思维方式都会发生变化,内容平台上所有的内容都会发生改变。大家只是暂时不知道这个新形态的内容会以什么互动方式来呈现,人们会怎么消费,是一边互动一边消费,还是像以前一样。

与此同时,现在是大公司、小公司都在同一个起跑线上探索这个问题,我觉得也许 3-5 年之后见分晓。站在今天的角度,就像前面提到的,大家从不同的维度去探索这个问题,有的人从媒介,有的人从内容,有的人从工具,有的人从平台,如果大家都能活下来,那么 3-5 年后也许会大战一场,甚至和传统的平台也会有冲突,所以很多时候我想的就是,现在做什么样的事情能让我们在 3-5 年后的竞争中获胜。


02 更多阅读


Linear Bolt 
Bolt 是线性资本为早期阶段、面向全球市场 AI 应用专门设立的投资项目。它秉持线性投资的理念和哲学,专注在技术驱动带来变革的项目,希望帮助创始人找到实现目标的最短路径,不管是行动速度,还是投资方式,Bolt 的承诺是更轻,更快,更灵活。Bolt 已经在 2024 年上半年投资了 Final Round、心光、Cathoven、Xbuddy、Midreal 等 7 个 AI 应用项目。


目标检测和深度学习
本公众号专注深度学习、计算机视觉相关技术、咨询。追求纯粹的技术,享受学习、分享的快乐,会不定期的推送人工智能前沿科技、相关模型代码实现、会议顶尖论文等学术资料和知识,欢迎大家分享和投稿!
 最新文章