抽象了一整年的2024,美团在年末又添了一把火——用「AI+短剧」制作年度报告,让用户在年度总结里过了一把“总裁瘾”。美团2024年度报告预告片
年度报告共设置了“职场”“豪门”“仙侠”三大题材,并分为男频与女频,共计六个剧本。
![]()
![]()
(注:项目已于1月7日下线)
“一年在美团消费640元,
这是集团总裁才有的实力啊!”
“听说你一年能在美团消费411元,
你却一分都不愿意花在我身上!”
![]()
图片源小红书
项目上线后,许多用户发帖评价
“笑晕了”“太癫了”“真会整活儿”![]()
当然,美团2024年度报告值得称道的,远不止是“刷屏”。
从项目本身来看,它可以称得上史无前例——首个结合AI、短剧的年度报告项目。不过,仅靠形式新颖,不足以被这么多用户喜欢。毕竟过去一年,我们看过太多翻车的AI广告。美团2024年度报告做对了什么,让新技术与创意完美结合?
以及更重要的,它是如何做到的?为了进一步了解背后故事,我们联系到美团市场侧项目负责人李静,以及WMY五米外项目负责人李文睿、项目视频监制朱茵,揭开这个史无前例的项目的背后故事。
美团2024年度报告立项之初,只有一个想法:要做不一样的年度报告。
这并非易事。作为每年末的保留项目,各大APP的用户年度报告一直有固定模式:H5互动,加上「用户使用数据+行为分析」,再配合「创意主题」与用户沟通情感。一直以来,大多平台都在创意主题上下功夫,从心理测试到MBTI,用流行文化沟通用户。而美团这次却打算换个思路,从更基础的内容形式上做出差异。李静:从情绪洞察上来看,每年年末的主流情绪极为相似,或温情,或感动,很难做出不同。于是,我们换了一种角度,从每年变化的热点,以及形式两方面进行思考。于是,我们很快地抓住了今年爆火的短剧,而这个内容形式本身,也包含了清晰有效的人群洞察——卖菜的大叔大妈会看短剧,大学生也会看,连莫言都说短剧上头。短剧爆火的背后,是一个质朴道理,在当前这个时代背景下,人人都想要向内收敛,寻求一点简单的开心。短剧的形式确认后,AI的加入也顺理成章。年度报告本质上是在为用户定制个性化互动内容,基于大数据分析与自然语言处理的AI技术,能将这一互动形式放大,使其成为真正“千人千面”的体验。有了耳目一新的形式,美团2024年度报告的脱颖而出已成功一半,而另一半还需要适配的创意灵魂。回看近两年会发现,大多翻车的AI项目和品牌短剧,都输在了空有形式,缺少创意灵魂。WMY项目负责人文睿坦言,为这次项目寻找人群洞察和创意主题,是一件很头疼的事。数英:创意主题「每个人都是生活里的主角」是怎样被挖掘出来的?
李文睿:年度报告要依托主流情绪,而前两年整个社会有一个主基调,比如,前年我们还在疫情中,而去年是疫情结束的第一年。当时,美团的主题是“生活的尽头和转角”,符合社会情绪,也很打动人心。而今年,整个社会似乎缺少了一些宏大叙事,我们很难总结出一种大家都认同的情绪。不过,这也在一定程度说明大家自我意识的觉醒,面对大环境的无奈,更多人会选择向内收,将注意力投向自我身上。在这一洞察下,WMY在比稿方案中提出「每个人都是最小单位的英雄主义」,当即打动了客户。在此基础上,WMY进一步延展,得到「每个人都是生活里的主角」这一主题。巧合的是,在比稿后不久,《喜剧之王单口季》决赛上,付航的一段“杀疯了”的脱口秀金句,与本次项目主题形成共振,也成为对创意主题的最好验证。![]()
项目初期,WMY团队想到利用AI换脸技术,让用户成为故事里的一员。而测试过程中,WMY团队发现,AI换脸很容易出现“恐怖谷效应”(当人类看到跟他们相似到特定程度的机器人或者虚拟人物时,会产生一定的排斥反应)。再加上AI换脸技术不够稳定,最终选择了放弃。寻找新的创意形式时,注意到了第一人称乙女游戏。这一形式极具代入感与可玩性。WMY团队很快尝试拍了一条demo视频,与品牌方快速达成共识,采用第一人称视角。李静和我们分享:“我们看了太多别人的高光时刻,既然这次我们要用户成为真正的主角,那么第一人称视角是一个更彻底的解决方案,它带来的感受最为直接。”数英:第一人称视角互动有很强的虚拟感和娱乐性,这是否会与年度报告中真实的生活细节,产生距离?
李静:整个创意最有意思的点,就在于这种又远又近的距离。我们设置了六个剧本,每一个的设定都是架空的,甚至是浮夸的,与我们的生活相去甚远。当我们通过AI技术,将用户的称呼、消费数据、常去商家等信息植入,又与真实的生活产生千丝万缕的联系。
很多用户在第一次看的时候会觉得“好癫”,其实就是又远又近的距离,带来的化学反应。
不过,美团项目团队和WMY团队都没想到的是,使用第一视角镜头带来了更多挑战。一是对拍摄要求高,为保证流畅感,大多镜头需一镜到底;二是对脚本要求更高,有限场景内尽可能制造爽点。更棘手的是,实拍的移动镜头,与AI技术衔接时容易出问题。李静说:“其实,没有任何技术是必选项,我们的任务只是在有限的时间内,做出用户体验感最好的产品。”这是个没有参考先例的项目,团队只能摸着石头过河。一切朝用户体验看齐,项目组开始了一次艰难的攀登。此次项目的主要形式是短剧,但本质上仍然是用户的年度报告。因此,在题材、时长、剧情、细节等内容的打磨中,需要考虑最终的呈现效果,以及用户的体验感。 1 题材确认:
本次项目中,共选择三个题材,职场商战、都市豪门和古风仙侠,分为男频和女频,共计六个剧本。《世界财富缩⽔亿万倍,⼤佬竟是我⾃⼰?》(职场商战男频)
《穿越后,三位仙尊要我宠》(仙侠女频)
数英:短剧的三个题材,六个剧本,是如何确认下来的?李静:一方面,我们要面向核心人群。从去年的美团年度报告中,我们发现18~25岁占比相对较高的用户群体。这个年龄阶段的女性,喜欢豪门千金或者逆袭复仇的题材;而男性用户相对更喜欢小龙王、赘婿的题材。如果你有注意到的话,我们年度报告打开之后,默认的选项就是豪门题材。另一方面,我们也要照顾到其他年龄层。对于中年的男性和女性用户,对于职场商战的接受能力会更高;而仙侠则是一个年龄覆盖更广的题材范围。 2 脚本打磨:
考虑到用户耐心与体验感,本次项目中,每个短剧的视频时长都在1分钟左右。时长压缩,但爽点和笑点仍要接二连三。此外,文案还要融入用户数据,将其称为推动剧情的关键因素。比如,“我们总裁最喜欢的是xxx,一年能在美团点xx次。你拿什么和我们斗!”是推动商战矛盾的要素;“竟然还用美团一年省下xxx元,这就是商业奇才!”是商战成功的标志。![]()
“剧本要考虑的,不只是剧情本身,还有视频效果。因此,我们基本上边写边拍demo视频,测试好所有内容形式,便于正式拍摄更加顺利。”
WMY的项目负责人李文睿透露,脚本的打磨经历了四到五轮。最初,脚本是按照常规的短剧写作的,有完整的起承转合,“但我们毕竟是一个年度报告产品,而不是短剧,所以我们不断删减,每个剧本都只留下了最直接、最精彩的地方。”
![]()
3 细节设计:
由于短剧采用第一视角,需要在一分钟内尽量减少剪辑次数,以避免破坏用户的沉浸感。与此同时,还要设置多个动作细节,来强化代入感。例如,伸手、低头、抬头,以及扇巴掌等具有冲击力的镜头变化,让用户能够迅速感受到自己就是故事主角。关于细节设计,李静特地提到一处设计:《绝世赘婿小龙王》开场就给主角(即用户)一巴掌。李静:起初,我担⼼这⼀情节可能冒犯较为保守的⽤户,但上线前的⼩范围调研和上线后的反馈显示,⼤部分⽤户不仅没有反感,反⽽觉得这⼀条“很爽”,实际传播效果也超出预期。作为品牌⽅,我们对于内容尺度把控还是⾮常谨慎的,因此在爽感和边界感之间的权衡和考虑会⽐较多。虽然这次剧本分成了男⼥两个类别,但其实不少⽤户会观看完所有的剧本,因此做好上线前的反馈调研,我们才能更好保障上线放量后的⽤户体验和传播效果。AI技术实现,有多少挑战?
两套兜底、三套备选——还是踩坑!“太难了”,从项目进入技术阶段开始,这句话就成了团队里的口头禅。
而其中关键的难点,不是新技术,而是成熟技术的全新应用。此次项目中,主要使用了TTS语音克隆、AI唇形驱动两项技术,在这里先做一个简单的科普。TTS语音克隆:即Text-to-Speech语音克隆,是一种将文字转换为语音的技术,同时还能克隆特定人的声音。简单来说,它可以让AI“学会”某个人的声音,然后用这个声音读出任何文字。
应用方式:
1、输入文字:比如,“您一年在美团消费了5000元”。
2、克隆声音:AI会先“学习”演员的声音特点(比如音色、语调等)。
3、生成语音:AI用克隆的声音把文字读出来,生成一段自然流畅的语音。
AI唇形驱动:一种用AI让视频中的人嘴巴的动作和声音完全匹配的技术。简单来说,它可以让视频中的人物“张嘴说话”,并且口型与语音完全同步。应用方式
1、输入语音:比如,一段TTS生成的语音“您一年在美团消费了5000元”。
2、生成口型:AI会根据语音内容,生成与语音匹配的口型动作。
3、应用到视频:将生成的口型动作应用到演员的面部,确保视频中的人物“张嘴说话”时,口型与语音完全同步。从应用来看,这两者都是相对成熟的AI技术。不过,这些技术,此前大多被应用于数字人直播、虚拟人动画等虚拟画面中,而美团项目组要做的是与真人短剧结合,并植入个性化用户数据。为了使声画流畅,用户体验舒适,项目组使用了两套兜底机制,以及三套制作方案。 1 三套制作方案:
由于短剧中的演员台词,包含了AI生成的个性化用户数据。因此,项目制作中的一大难点是,在植入数据后,保证演员说台词的口型、表情、动作和背景,都不会发生变形。其中,最具挑战的是演员的表情和口型,尤其是特写镜头。为此,项目组测试了多个制作方案,最后发现演员闭嘴拍摄,与语音素材的融合最自然。因此,在正式拍摄中,所有演员素材均为闭嘴拍摄,仅用眉毛、眼睛等表情传递情感,再用唇形驱动模型生成与语音同步的口型。演员闭嘴拍摄素材
项目中,不同的片段对演员表情和口型的精确度要求也不尽相同。为了尽可能提高效率,并保障顺利执行,项目组针对素材的不同情况,制定了三套执行方案:纯语音克隆、唇形驱动+语音克隆、纯兜底的视频。① 纯语音克隆:用于对演员口型精确度要求较低的场景,如演员不露脸、旁白场景,仅使用语音克隆。利用AI克隆演员的音色,并把文案脚本转换为语音,生成自然流畅的音频后,与拍摄好的视频素材匹配。
② 唇形驱动+语音克隆:用于对演员口型精确度要求高的场景,如特写,或演员表情夸张的镜头,在语音克隆的基础上,使用AI唇形驱动技术,将演员的表情与生成的语音匹配,确保口型同步,表情自然,增强视频的真实感和沉浸感。
③ 兜底视频:预先拍摄并制作好的通用视频片段,作为备用方案。在调取出现异常时,直接使用这些视频片段,确保用户体验不受影响。
总体来看,一条视频素材制作的大致流程如下:
在确认文案脚本后,选择需要调用的用户数据进行预处理;利用语音克隆技术,克隆演员音色,并将文案转为声音。与此同时,拍摄原生视频素材,并在拍摄现场,单独录制演员在环境中的声音与画面素材,训练AI模型。然后,根据演员表情和口型的精确度,判断是否采用唇形驱动技术,结合视频与声音素材。除了将方案设计精细化,项目组还准备了兜底方案,应对潜在的不稳定因素。 2 两套兜底机制:
整个项目中,共准备了两套兜底方案,兜底文案和兜底视频。![]()
它们并非针对AI不稳定性而设计的备选方案,而是为了应对部分用户数据缺失、网络或服务器不稳定。
● 兜底文案:主要应对场景为,用户某些部分数据缺失。比如,已注册但未消费的用户,他的消费金额可能是0元,在这种情况下,模型就会调出兜底文案,来解决这一问题。
● 兜底视频:主要应对场景为,网络或服务器不稳定。当千万级用户访问时,容易出现等待超时或调取内容失败,为了让用户体验不会太差,一旦等待时间超过预期时长,就会直接调取兜底视频,保障用户体验顺畅。
项目视频监制负责人朱茵透露,与常规视频制作相比,本次项目最大的不同就在于交付文件上。为了使项目执行顺畅,每一条有数据植入的文案,都需要至少三份交付文件。第一份是拍摄的预设素材,第二份是语音克隆/唇形驱动素材,第三份是纯兜底视频素材。三套精细化的制作方案,以及两套兜底机制,为项目的顺利运作打下基础。而在实际执行过程中,项目组仍遇到了不少问题。 3 三个“踩坑”经验
当项目制作加入了AI技术,最常出现的问题不只是AI不稳定性,还有技术整合的挑战。尤其是,像此次项目,混合使用了实拍与多种AI技术,兼容性与适配性问题的出现,也变得在所难免。● 设备器械踩坑
由于短剧采用第一人称视角,需要大量运动镜头(如推拉摇移)。每个镜头的移动方式都需考虑,与算法素材结合时画面是否会变形,以及唇形驱动、语音克隆等AI技术是否会出现问题。项目组在拍摄前进行了大量测试,一边写脚本,一边拍摄视频,一边拿给技术团队测试,在验证可行性后才正式拍摄。然而,没想到的是,拍摄demo视频时使用的设备与正式拍摄的专业摄像机不同,导致团队在正式拍摄时出现新的问题,只得再次重复测试。小经验:加入AI技术的项目制作中,前期测试往往占据很多时间。因此,需要确保测试设备与正式设备一致,避免重复测试和资源浪费。
● 协作流程踩坑
初期,项目组计划用AI转绘,制作纯AI仙侠篇,发挥AI在超现实风格上的优势,与豪门、职场等现实风格剧本形成差异。但测试中发现AI转绘不稳定,人物呈现不连贯,最终放弃,改用绿幕拍摄人物,再后期合成场景。在测试阶段,项目组每拍完一段绿幕素材,就导出交给AI团队进行测试。而在与后期场景成后,人物面部发生细微变化,这种变化在正常视频中不会有问题,但是因为这次涉及一颗镜头分切输出,即对每一段分割后的素材进行高精度的合成处理,所以对于合成的准确性产生了极高要求。小经验:AIGC内容的不稳定性,可能会出现在方方面面,对于精度要求较高的商业项目,需要各方充分测试,以确保协作效率与效果稳定性。● “难以预料”的踩坑
项目采用TTS语音克隆技术,将文字转换为语音。测试中发现,面对生僻字或不同长短的句子,有时会出现“电音”情况。尽管概率极小,项目组仍对数万个生僻词进行测试,确保准确性。然而,项目上线后仍出现一个有趣bug。在《绝世赘婿小龙王》剧本中,用户称呼“x少”(shào,四声),但当用户姓“钱”时,“少”的读音变为三声(shǎo,三声)。小经验:即便再详细的测试,也很难对AI生成的不稳定性,进行穷举,只能尽可能避免显著错误,同时要注意潜在的语言和文化特性对技术的影响。 4 一些没来得及实现的遗憾
在项目中,短剧观看结束后,用户会跳转浏览消费数据。随后,再引导用户与短剧中的AI角色进行对话。起初项目组设想,在AI对话环节,引导用户开放性输入问题,比如,消费金额最高的类型是什么?但最终为了简化产品的体验流程,降低互动门槛,项目组将其调整为引导性对话,通过点击选项,与AI助理进行沟通,再引流至Wow(美团旗下AI社交APP)体验完整版。“如果时间足够,AI团队完全可以调校出一个更好的聊天模型。”李静向我们透露,整个项目只用了两个月时间,加上许多技术都是初次尝试,项目组就像是在黑夜里行走,踩坑是常事,但只要多走几次,就能熟稔于心。
数英:项目中还有哪些遗憾?或者还有机会再优化的地方?
李静:有很多地方都可以再去优化,比如,协作流程上,进行充分测试;使用AI转绘,制作纯AI风格的视频,以及AI聊天界面,可以提升更多的自由度。
这次完成这个项目后,我真正体会到了与AI共同成长的感受。在整个应用过程中,我们对AI始终保持克制的态度。我们没有简单地将它视为一个噱头,我们甚至思考说,是否要告诉用户我们使用了AI。
未来,AI一定会更加成熟,我们的策略也会更加多元,而我们对AI的应用也会更加灵活。
聊完项目制作经历,我们最直接的感受是,使用AI真的是个技术活儿。
2023年初,AIGC刚走红,行业内涌入大量AIGC创意,但大多只是将AI作为噱头;2024年,出现深度使用AIGC的案例,但也有了更多的翻车案例。到了今天,AI早已走进很多人的工作与生活,而在与创意营销的结合上,也要探索更为深层的融合方式。短剧与营销的结合,也同样正在走入深水区。与一年前相比,短剧快速经历了从粗制滥造到精品化制作,太过同质化的内容,再也无法获得观众和流量。如何才能在营销中,更好地使用AIGC?如何看待短剧的爆火?我们和此次项目组的三位负责人一起探讨。
数英:通过这次项目,在AI与营销的结合上,有哪些心得与体会?
李静:项目上线后,我在小红书上看到一条笔记,他说“今年各大APP的年度报告都冷冰冰的”,而下面一条高赞评论推荐了美团的年度报告,并且评论说“很有意思”。再翻看评论区,你会发现很多人说,因为写文案的人被AI取代了,所以这些报告才变得没有人情味。![]()
同样使用AI,为什么美团的年度报告会被认为是“很有意思”?我想,这是因为我们在正确地使用AI。就像我前面所说,在整个项目中,没有任何技术是必选项,我们的目标只是做出用户体验感最好的产品。在这个项目里,大家都先看到了「人」,再看到「AI」,这说明我们的确与AI建立了一个良性的合作方式,不仅不会被替代,而且能玩得很好,还能让大家喜欢,这是整个项目让我最兴奋,也是最感动的一个地方。
数英:从营销的角度来看,为什么有的AI广告会翻车?有的却能够大获成功?
李文睿:过去几年,许多项目利用AI作为噱头,但随着时间的推移,AI会逐渐回到技术的位置上。但不同于之前的三维CG或者H5,AI能够从更为深层的内容角度,与创意进行结合。所以,正确地使用AI需要我们更深入了解技术,思考如何将其与创意领域结合,创造出真正有价值的东西。比如,去年的一支法国公益广告,利用AI换脸技术,把女足运动员更换为男人的面孔,在视频末尾才揭开真相,告诉大家女足同样精彩。在这种创意中,打动人心的不是AI,而是它所传递的精神。AI技术之于创意,就像是一道“调味料”,它能够让创意变得更加有滋有味。法国通信公司Orange
《la Compil des Bleues》
数英:关于短剧,相关部门出台规定要对“霸总短剧”加强监管。这也与去年,短剧井喷造成同质化有关。如何看待这一现象,以及怎样保证短剧能够传递积极向上的价值观?李静:在我看来,短剧和TVC、Social video类似,是一种新的内容形式,近两年,短剧爆发后衍生出一个庞大的行业,从品牌营销的角度来看,已经成为一种有效的沟通工具,并不局限于某种单一的风格或表达方式。虽然我们现在谈论短剧时,往往联想到粗制滥造、又土又俗,但短剧并不只意味着这些,它也可以涵盖更多元的题材。关键在于,如何充分利用短剧这一形式,以及它的应用场景和目标。如果目标是让用户开心或享受乐趣,那可以选择多元化的题材,或者找到一些新的语境。例如,“小龙王”已经被一些平台过度使用,但放在年度总结中,又能焕发新的生机。对于短剧的未来发展,我持乐观态度。尽管同质化现象存在,但随着不断发展,一定会更加有深度和价值。至于传递价值观,我认为,品牌不必强制传递某种特定的价值观,品牌更多的是站在用户角度,思考他们真正关心的内容,才能与他们建立情感连接,沟通出有趣有意义的内容。
数英:最后,想请各位用一句话总结这个项目带来的收获。李静:这是一个很难的问题。对于这个项目,我真的百感交集,如果非要选一句话,我想引用那句话,Success is not final, failure is not fatal. It is the courage to continue that counts. 成功不是结局,失败也不是致命的,继续前进的勇气才是最重要的。做这么庞大又复杂的项目,我曾经有很多个后悔的瞬间,但坚持下来以后,真的非常开心和感动,这个项目让我找回了做Marketing的初心,也找回了探索新世界的勇气。
![]()
图源电影《至暗时刻》
李文睿:我⼀直记得当客户提到这个idea时,我⼼⾥的兴奋和忐忑,有时候⼈还是要相信直觉。这是一个真正从0到1的项目,未知越多、挑战越大、收获也更多。如果用一句话来总结,好的创意在诞生那一刻,一定会伴随着兴奋和忐忑。越好的创意,兴奋和忐忑越成倍叠加。
朱茵:站在制作方的角度,我想说,尽管人们说AI会代替人类,但最终,是我们借由AI看到了更大的世界。
新技术,新形式。生活在科技突飞猛进时代的我们,总会遇到新的变革和挑战。而几乎所有的开拓者,都告诉我们,重要的不是技术,而是人本身。AI可以无限复制人类艺术,却无法从0到1去创作,而人类凭借着智慧和勇气,可以从无到有,也可以克服任何困难。沿着旧地图,找不到新大陆。当AI出现,它被称为潘多拉魔盒,也被看作黑暗丛林。但归根结底,它是一门拓展人类可能性的技术。或许,我们该做的不是担忧,而是带上勇气,踏上新的旅程。采访:Sylvia、Molly
撰文:Sylvia
【往期回顾】
百万广告营销人,都用数英
![]()