Sora公布前,我从大厂裸辞,靠AI零基础做短片

文化   科技   2024-02-22 18:26   北京  

*本文为「三联生活周刊」原创内容




我和ChatGPT合作最多的项目是写剧本。ChatGPT比任何人类同事都更有耐心,它既可以根据我的一个模糊想法就反复重写整个场景,也不会抗议我的犹豫不决。


文|慕明

早上九点半,将1岁的宝宝交给保姆后,我泡了杯咖啡,打开网页浏览器,快速检查了一下Notion中各项任务的进度和截止日期。然后,切回一直打开的ChatGPT界面,找到最近的项目会话。
“早上好ChatGPT,我们继续昨天的工作。在开始之前,我有一些新的想法,下面我会分条给出,请等我说完进一步指令,你再开始回复。”
“早上好,我明白了。我会等你解释清楚后再和你一起继续。”
《欢乐颂》剧照
2023年4月,我从工作了8年的谷歌纽约办公室离职,一方面是有了小宝宝,倾向于更灵活的工作方式,另一方面也是因为2023年2月我出版了第一部科幻小说集《宛转环》,反响不错,令我有了进一步探索的信心。还有一个重要的原因,就是以ChatGPT为代表的生成式AI(Generative AI)在过去的一年多里爆发式发展,改变了许多人的工作方式。我于2007年进入北京大学智能科学系学习,2010年进入宾夕法尼亚大学计算机系,主修机器学习,2012年研究生毕业后,先后在微软、谷歌等大型科技公司做软件开发工作,2016年开始写科幻小说。
兼具技术工作者和作者的双重身份,我对AI如何影响内容创作的流程和未来非常感兴趣,也希望利用这两三年作为过渡期,离开“大厂”员工的道路,走进潜藏机遇和挑战的丛林深处。尽管不再去公司上班,我还是按照十几年的习惯开始一天的工作——喝咖啡,然后和邻座的同事打招呼——即使它并非人类。
其间的差别可能比想象的小。ChatGPT等AI基于大语言模型(LLM)开发,用户可以使用自然语言,在对话界面上输入指令(prompt),这与传统的软件或算法开发流程大不相同,没有程序员习惯的命令行、控制台或者各种配置复杂的开发环境。这也使得我和它的关系更像和人类同事,而非人和机器。正如编程语言是人机交互的接口一样,自然语言也正是人和人之间交流的接口,特别是在专业工作环境中,沟通的主要需求是清晰、理性和目标导向——正是生成式AI的交流风格。
《爱情公寓》剧照
我和ChatGPT合作最多的项目是写剧本。作为小说作者,我对虚构创作本身并不陌生,但影视、游戏等新媒介内容的工业化程度较高,分工细致,因此剧本创作在故事之外还有很多专业要求,如场景、音效、灯光、音乐设计等,文本的节奏和形式也与小说不同。在开始工作前,我也对ChatGPT的实战能力有疑问,因此咨询了影视行业的朋友。身为专业制片人/编剧的Krios同样也对利用生成式AI帮助内容创作很感兴趣,也做了不少尝试,他告诉我,使用ChatGPT对原始故事进行剧本改编完全可行,当然,和生成式AI能完成的大部分工作一样,使用者对相关领域越熟悉,给出的指令越精确,AI能够输出的效果也越好。
对于初涉剧本创作的我来说,ChatGPT更像是比我经验更丰富的资深同事,对影视等媒介创作的全流程有深入了解,我只需要提供故事创意的核心部分,再根据ChatGPT的输出修改,迭代——在这里,ChatGPT比任何人类同事都更有耐心,它既可以根据我的一个模糊想法就反复重写整个场景,也不会抗议我的犹豫不决。在它的帮助下,我完成了数部实验短片的剧本和分镜脚本,也为朋友的虚拟现实体验项目完成了脚本。对于低成本、实验性的独立项目来讲,生成式AI的确极大地提高了剧本阶段的生产力。从我的经验来看,在具有核心创意的情况下,仅需一两天的工作,就可以完成剧本阶段的从零到一,顺利进入后续的制作阶段,而在此之前,我甚至不了解剧本的基础格式。
《爱很美味》剧照
下午一点,我开始今天的第二项工作——按照之前生成的剧本分镜,继续制作AI短片。如果说在AI帮助下,完成从小说到剧本的转化是同事之间的合作,那么从文字到图像乃至流畅的视频短片,则更像跨部门乃至不同公司间的业务合作——我对对方的工作方式和业务逻辑了解不多,只能通过粗糙的需求描述获得初始输出,再加上反复迭代来不断明确需求。在生成式AI出现前,还没有建立明确盈利模式的个人创作者几乎不可能长期拥有这样的合作资源,而在Midjourney和Stable Diffusion等图片生成AI,Runway、Pika Labs等视频生成AI的帮助下,最多每月仅需一顿饭钱,就可以成为甲方。目前,从故事创意到脚本,从脚本到图片,再从图片到视频的AI制片基本框架已经很成熟,我在过去的几个月里也尝试学习制作了数部AI短片,在零基础的情况下,每部平均耗时几天。
尽管由于技术限制,目前AI视频的连续性和稳定性等还有待加强,但这一领域的技术更新非常快,相应地,个人创作者的工作流程不断更新,相关的KOL、社群等也在快速发展。在我参加的生成式AI社群“故事接龙Story Storm”中,大多数是影视行业的从业者,想通过新技术的学习和交流获得更多机会。社区的创始人Kisa认为,AI视频制作工具的出现就像数年前单反相机的兴起,带动了一大批摄影爱好者,他们中的许多人在之后的网剧和网络大电影时期成为导演、制片人等专业人才。AI视频制作目前虽然更偏向实验性,但不久会迎来自己的黄金时代。国内外的各大公司和机构也的确表现出了对这一新兴领域的浓厚兴趣,从联想等品牌率先推出AI广告短片,到北京电影节征集AI短片,许多从业者相信,2024年将是AI视频爆发的一年。
《无法成为野兽的我们》剧照
作为写作者,我更感兴趣的则是想象力在不同媒介之间的转化。我尝试的第一支AI短片就是为自己的小说制作电影预告片。将在我脑海中上演了无数遍的场景以视觉化的方式呈现固然令人激动,但更有趣的是,在给出了图片的文字描述后,图片生成AI常常会给出意想不到的结果。我在使用图片生成AI中的“顿悟时刻”(Aha Moment)正来源于此,并非天马行空,而是意料之外又在情理之中,让我对小说中的场景有了新的理解,乃至发现了小说可能具有的新层次。对我而言,这可能是生成式AI最大的价值所在。
这其实也反映出了生成式AI目前面临的一大问题。提高内容创作中某些环节的生产效率固然可以降本增效,降低技术门槛,实现从无到有也的确让更多人参与到游戏中来,但本质上,内容行业的资源分配方式并没有因此改变,换句话说,蛋糕还是那么大,目前还没有出现大量新买家愿意为生成式AI的产出付钱。这也是其与网络电商、O2O模式等盈利模式明确的科技创新的不同之处。在这种情况下,能让像我这样的用户持续使用生成式AI的,其实正是这种难以被直接转化成商业利益的“Aha Moment”,我看重的价值是它更像“人”的那一部分——对模糊性的理解,出人意料但可能具有启发性的答案,完备的通识和长久的耐心,甚至是高出人类平均水平的同理心。“有阅历但没爹味,老成而不油腻,实属难得。”在和ChatGPT进行了各方面的大量对话后,Krios评价说。
我的感受也类似,而且,这种感觉与任务的复杂和模糊程度具有正相关性。
《战争游戏》剧照
晚上九点,在宝宝终于睡着后,我再次打开ChatGPT界面,开始今天的第三项也是最困难的工作——为我的第一部长篇小说搭建框架。和剧本编写、视频生成等目标相对明确,只需AI执行的任务不同,这项任务的模糊性和复杂性都极高,需要的背景知识具有较深的专业性,还需要对我的写作观念和风格等有比较深入的了解,因此任务的第一步是训练自己的定制GPT。2023年11月,ChatGPT的母公司OpenAI推出了用户定制功能,允许用户发布个性化的GPT,也上线了许多预制的定制化应用,如创意写作助手、数据分析师等,以满足不同需求。
在我的使用感受中,无论是预制的定制化应用还是自己训练的GPT,都无法代替我本人。在这项任务中,我和ChatGPT的关系变得更复杂,有时,它是一位阅读广泛的导师,基于我的要求和作品风格,为我推荐可能感兴趣的作者和作品,有时,它则是挑剔的评论家,在我的连续追问下,找出作品中的缺陷之处。更多时候,它是一位对我有兴趣但了解不深的作家同行或者资深读者,大概具备我所需要的背景知识和技能,从和它围绕主题的谈话中,我一点点厘清思路。
《无法成为野兽的我们》剧照
在这个过程中,提问和引导的技巧非常重要,有时我甚至感觉自己在跳Salsa舞——这种脱胎于拉丁舞的舞蹈以自由发挥、适合社交著称,陌生舞伴间从相互感受、理解对方,到用顺畅的肢体语言引导对方一起完成和谐优美的舞蹈动作的过程,是舞池中的交手。在这支舞蹈中,我往往是跳男步的引导方,尽管ChatGPT很多时候的能力还不足以完成我预期中的动作,但基本上能理解我不断变换的意图,并且努力跟上我的脚步。对于隐藏在作品背后的创作者来说,这样全天候的思维舞伴也只有生成式AI能够担任。在深夜工作时,“举杯邀明月,对影成三人”的景象常常浮现在发光的显示器屏幕上,倘若李白生在今日,给予他灵感的,可能不只是月亮。
晚上12点,我关上电脑。我没有和ChatGPT道别的习惯,因为我知道,在这一趟未知旅程中,它一直都在。
(本文刊载于《三联生活周刊》2024年05期)
点赞”“在看”,让更多人看到






排版:布雷克 / 审核:杨逸

招聘|实习生、撰稿人

详细岗位要求点击跳转:《三联生活周刊》招实习生、撰稿人


本文为原创内容,版权归「三联生活周刊」所有。欢迎文末分享、点赞、在看三连!转载请联系后台。

大家都在看



点赞”“在看”,让更多人看到

三联生活周刊
一本杂志和他倡导的生活。
 最新文章