数字人狂奔600天,还有四大槛

文摘   2024-09-03 17:30   广东  



要跨过场景、ROI、落地门槛、竞争壁垒四重门槛。‍‍
‍‍‍‍


作者|徐鑫‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
‍‍‍‍‍‍‍‍‍

编辑|任晓渔

来源|数智前线



作为大模型落地的最热门领域之一,数字人赛道在过去一年半时间里快速变动,并呈现出了四大动向:


一方面,大模型技术驱动下,数字人的交互能力和用户体验都有了不小的提升。比如从原来的换嘴式、非实时的阶段,进化到了能驱动全脸的表情,完成简单的全身动作。


其次,企业应用AI数字人,目标也非常明确和务实,就是要创新业务和帮助企业降本增效。在直播带货、数字人客服、虚拟主播等ROI较好测算的场景,数字人产生的价值最明显,也在率先实现落地。


三是,针对企业应用数字人普遍面临的成本高、难落地等问题,厂商们已经采取了一系列动作,包括降价、开源以及持续的产品技术投入,来降低数字人应用和落地门槛。


而随着行业里大小玩家卷技术,卷价格,同时数字人应用成巨头标配,竞争也不可避免变得激烈起来。业界也在形成共识,创业团队要走出差异化路线,并尽快实现自我造血,才有发展空间。



01 


大模型落地的最热门场景之一


去年下半年以来,厂商们在加速探索大模型落地企业的合适场景和路径,数字人被不少厂商列为了模型落地的先锋场景。


今年6月,百度智能云在一场内部交流会上提到,3月他们把曦灵数字人作为大模型落地的7款标杆应用之一。到6月,数字人作为3个重点应用之一被再次加码。他们提到,企业内部知识管理、客服、营销这几个环节,是当下大模型能帮助企业增收提效的最佳路径。


无独有偶,上个月京东言犀数字人升级到3.0版本,京东言犀大模型团队在媒体交流时提及,数字人是他们探索大模型落地时最大的创新应用,并且数字人在大模型与终端交互中占据重要位置。


“数字人和智能体、具身智能是未来大模型与终端用户的核心交互介质,智能体更偏云端,数字人更偏端侧,具身智能更偏向线下的物理世界。”该人士说。



蚂蚁灵境数字人团队相关人士则看到,数字人是大模型能力的载体之一,“大模型与数字人结合后,具有无需人工干预的自动交互能力,再结合多模态交互能力,有助于提升人机交互体验”。


随着厂商积极将大模型技术与数字人结合,数字人在交互能力和用户体验上也在快速升级,生产成本也大大降低。


“以前是换嘴的那种,非实时的,现在可以做到驱动全脸的表情,并且也能做一些简单的全身动作”,中科深智CTO宋健观察,最近半年2D数字人与大模型结合,进展非常快。


行业里此前有一种说法,一些名人的数字人表现得动作单调,且经常重复,因为采取了类“录播”逻辑,它只能重复“播放”与提供的视频物料,例如提供的视频是坐着的形态,数字人就没有其他姿势和形态。


宋健认为,在大模型的支撑下,数字人就会摆脱这类情况,可以生成更多的动作形态。这个过程分为两步,首先是用来自互联网的几千万、几亿量级的图片、视频等数据,训练一个基础模型。


第二步是把目标人物的素材喂给模型,生成与目标人物的ID特征、形态等各方面比较吻合的数字人。现在比较热的多模态模型跟数字人结合,就是干这个。通过提供的图片、视频和语音资料来获取人物本身的动作特征等,生成新的内容。“目前阶段,要完全实现这一点,也有两个难点,一个是成本高,另外生成的内容有时候会有些幻觉,质量有些瑕疵”,宋健说。


大模型加持下,数字人还在音色、韵律、表达的丰富程度上都有了比较明显的提升。


比如在音色方面,京东言犀数字人团队介绍,“大模型升级前,数字人的直播间说321倒计时,对于321突然的节奏、音调的变化,数字人表达得相对会比较机械,没有那么自然,现在整体自然很多,变得更像真人。”


大模型还使得数字人的生产成本在降低。“以前需要提交很长时间的素材,这些素材还要拿回到模型去训练,现在提交的素材变得非常简单,比如给几秒钟的语音,相当于Prompt的方式,大模型可以秒级复刻,不用拿回模型再训练。”一位数字人行业资深人士说。



02 


算得清ROI的场景,正率先落地


正如大模型落地到其他场景一样,企业对AI数字人的应用和落地态度也走向理性。


IDC中国研究经理程荫告诉数智前线,当下,企业对于AI数字人的应用主要出于创新业务和帮助企业降本增效考量。当前数字人价值最明显的领域在直播带货、数字人客服、虚拟主播等场景,ROI较好测算。


直播领域也是公众最熟悉、最热门的场景。业界观察到,目前这个场景里,平台的态度和政策有明显差异。


6月腾讯发布了《视频号橱窗达人“发布低质量内容”实施细则》的修订意见征集通知,修订后的细则规定,在直播过程中存在使用非实时直播内容或道具代替真实直播的行为都被视作非真实直播,属违规行为。虽然这是一则修订意见征集通知,引发了行业内广泛讨论。快手之后也提出不会对AIGC辅助创作内容给予额外流量扶持。


与之形成鲜明对比的则是京东这样的电商平台。今年4月,刘强东亲自上阵支持数字人,采销东哥AI数字人上线后引发了4000万人围观,到6·18京东还大秀言犀数字人的直播成绩。相比而言,京东对数字人直播显得友好许多。


一位数字人企业高管告诉数智前线,平台的态度差异其实与平台属性及数字人当下的能力边界有关。电商平台里,直播最重要的角色是讲解商品信息,需要去做的肢体动作和任务相对而言比较单一。相较而言视频号等社交属性更突出的平台里,直播时人需要去完成的动作和任务会更为复杂和多元。


“目前数字人的技术去完成商品讲解的任务基本能满足要求,但是许多大量的娱乐化内容,需要去表演去做复杂的动作,数字人目前还不能胜任。”这位行业资深人士认为这可能是不同平台从平台调性出发,形成差异化态度的症结。


另一家数字人公司的创始人则认为,平台公域里流量要算利用效率和成本,质量不达标的数字人直播,流量的利用效率也低,平台就很难用公域流量去支持,因此关键还是看数字人内容的质量。


不少数字人厂商已经把ROI为正作为吸引更多企业用户的卖点。比如特看科技此前告诉数智前线,目前他们两款产品,一款从文案到表达都是AI完成的数字人,企业每投入1块钱,能够收回2块钱。另一款真人驱动可以换脸的产品,相比前一类数字人多了一个客服讲解的人力投入,但总归企业投入后能赚钱。


快手在今年WAIC的一场论坛上也提到了客户使用女娲数字人平台,已经能拿到相对确定的结果。一般行业内真人主播的投入一年至少在55万以上,还有场地和设备以及直播的其他人力投入若干。而数字人相比在3~5万一年,不需要专门的场地投入,设备和运营投入相比真人主播也大幅降低,但从收益来看,数字人主播已经接近真人主播水平。


可以说,行业内对当下数字人主播的收益已经有相对理性的认知。一方面,大家用数字人对标的不是头部的主播,而是超越行业80%水平的主播。一些数字人企业还会给市场泼冷水,称数字人并非灵丹妙药,那些靠真人都卖不出去的产品,用了数字人也很难大卖。


除了率先应用和落地的直播场景,厂商们也在积极探索将数字人应用到医疗、政务、金融、文旅等行业。不过IDC指出,除了ROI能方便测算的场景,数字人带来的业务价值不好测算是其应用到更广领域里要面临的挑战之一。



03 


降低成本和使用门槛是重中之重


AI数字人快速推进,厂商们也需要直面和解决新技术落地遭遇的挑战。业界观察到,除了如何评估真正带来的业务价值外,AI数字人落地还普遍面临成本、易用性和后期运营等多个层面的挑战。


一家大模型厂商坦言此前探索数字人直播应用时踩过一些坑,这里面就包括当下数字人技术距离真人的表现仍有很大差距,同时数字人的使用门槛和成本都不低。厂商们已经意识到问题,并着手解决。


数字人的易用性,涉及到从生产制作到配置、运营的全过程。


生产制作层面,目前行业解法是从模型着手,提升模型的鲁棒性,降低对数字人生成所需素材的要求。比如只用提交一张照片,几秒的语音素材,就能生成数字人,大量的工作通过后端的技术和算法搞定。


这也是目前不少厂商在探索的小样本和零样本技术。训练好基础模型,新的数字人生成时不需要再拿到底层模型训练。“只用听这个人讲几秒钟或几分钟,模型就能吐出来相应的语料语句。”一位行业人士说。


厂商们还很重视将数字人的生成制作、上线过程沉淀到平台化的产品里。比如京东言犀数字人团队介绍,他们现在新拍摄一个数字人的数据,从数据的处理,基于训练效果的调优,到模型的上线,以及Demo的制作,完全都能由运营来完成。“产品化之前还需要很多算法去调,现在完全基于数字人的平台可以完成,这提升了数字人上新的效率”。


生产完了之后,怎么快速在生产场景配置起来也是企业关注的点。比如直播场景里快速搭建直播间,需要数字人厂商有相应的产品和功能去支持。百度曦灵数字人相关人士介绍,他们在数字人直播场景做了多平台覆盖,可以基于商品自动生成直播间,加速产品应用。


由于大模型技术的发展,目前百度、京东、腾讯、商汤等多家厂商都强调过数字人的制作难度和制作周期已经有了大幅缩减。


IDC还看到,未来数字人厂商的服务模式也很重要。他们听到很多行业用户反馈,在一些直播场景下的AI数字人厂商不具备代运营服务能力,而企业自己运营起来难度也非常大。因此,目前行业里已经有一些厂商把代运营纳入到了付费服务中。


产品和技术之外,行业里也有人反馈一些数字人的价格问题。目前行业里数字人的价格相差比较大,有几千元一年的产品,也有厂商拿到千万元级的大项目。千万级的项目可能是一些地方政府做的城市数字人整套解决方案,包括了硬件,数字人产品是其中的一个组件。



也已经有厂商从价格和获得门槛入手,加速数字人的普及和应用。今年6月,在百度智能云大模型产品应用发布会上,百度智能云副总裁喻友平宣布,2D数字分身和3D数字人的价格分别降至3000元和1.2万元,百度称,它们的2D数字人低于行业平均价格60%,3D数字人低于行业最低价格90%。


喻友平认为,这能让更多的企业和用户能够使用上数字人,“一旦数字人的价格能够真正有大幅的下降之后,数字人将得到普遍应用,加快在文旅宣传、视频制作、直播带货、企业导购等各种场景普及。”


还有企业通过开源开放的手段,来加速数字人技术的普及。比如硅基智能在6月宣布开源其AI数字人交互平台,使开发者能快速创建并部署智能数字人。


IDC认为AI数字人技术使用的平民化正成为市场关注的重点。如何通过相关技术降低产品的使用和成本门槛将成为未来竞争的关键因素之一。



04 


巨头炮火下,创业公司的机会在哪里


去年到今年,一家布局过数字人业务的企业正在降低数字人板块的权重。这与该企业创始人对数字人市场格局的判断有关。


“之前我认为竞争对手是一些A、B轮的公司,随着大厂纷纷投入,比如字节大力投入剪映,视频类自动化生产工具未来大概率处于大厂射程之内”,这位创始人因此将数字人板块的业务权重降低,仍然保留技术投入,但是缩减规模


中科深智宋健也认为,市场当下的确在发生一些变化。数字人应用已经从一开始令人有些猎奇的存在,慢慢变成一个基础的组件,大厂和平台级公司进场将数字人作为大的服务包里的一个模块


IDC分析市场头部供应商格局时告诉数智前线,目前明星AI创业公司因较早进入市场,在数字人板块,产品矩阵较为完备,市场认知度高,展现了较强的商业化能力;而以云服务为代表的平台级公司,优势在有一定的品牌知名度和用户基数,且借助合作伙伴和渠道力量,可以快速推广产品。“以此来看,未来的竞争肯定是更加激烈”,IDC程荫说。


“平台企业在市场拓展或渗透阶段,不会把成本作为最重要的考量因素,因此对赛道里的创业团队而言,如果不能获得营收,不具备商业可持续性,可能就没法往下走。”宋健告诉数智前线。


不过这并不意味着大平台之外的玩家没有发展空间。


大厂走的是通用路线,做的是标准化的东西,但其实每个行业都有复杂的需求”,宋健说,比如,用数字人做服装模特,听起来很简单,但大平台的产品很少渗透到这个细分市场。因为需要针对数字模特再去定制一套系统,从模特的选型到衣服试穿,还需要专门去展示服装的动作,这些可能是用于短视频或者直播平台。但这些需求并非标准化的数字人模块就能完成。


创业团队如何基于非标准化的产品形成商业闭环,因而成了AI数字人赛道,创业团队与大厂差异化竞争的关键。


数智前线获悉,目前中科深智就在探索,利用数字人做短视频来完成客户的互动营销需求。这里面数字人和内容只是其中的一环。比如一些企业的线下店,通过线上的数字人视频投放引流。给客户提供的服务,既包括要针对店铺去生成合适的数字人带货视频,还包括把视频投放到不同的区域,获得本地流量。基于视频和流量,形成了数据和商业运营的闭环,并且不断去改进视频内容的组合方式,最终靠CPS(按实际销售额来计费的广告,可以理解为销售额提成)的流量来付费。


“只提供一个工具,就是与大厂正面PK,但如果是带有CPS服务的非标产品,双方就不在一个维度竞争”,宋健说。


这种态势下,玩家之间的竞合关系也在变得更为多元。数智前线了解到,在标准产品满足不了客户场景需求的场合,大平台也会带着中小数字人团队共同服务客户。比如特看科技的乐乘就介绍,他们目前也在与大厂合作,集成到大厂的产品模块里共同去服务一些医药行业的市场,“靠我们自己拿不下这样的客户,通过API的方式集成到大厂的产品里,各方是多赢关系”。


市场已经卷起来了,不过当下AI数字人依然处于起步阶段,IDC判断,到2026年中国AI数字人市场规模将达到102.4亿元人民币,距离市场成熟还需要时间。而无论是创业公司还是平台级企业,未来在这个市场都需要努力建立技术壁垒,以抓住机会。

END



观看中国人力资源管理数智化发展白皮书全文请扫下图二维码


期待你的

分享

点赞

在看

青贝克智慧工场
中国人力资源开发研究会智能分会官方公众号,致力于推动人力资源智能化的研究与应用,促进相关人才的职业技能培养和职业发展,提供相关学术成果、专业知识、实践案例和专业化咨询服务,组织智慧沙龙等,为您提供一站式的人力资源智能化的共享平台。
 最新文章