Unity HDPR虚拟数字人技术探索与实践

文摘   科技   2024-07-09 12:00   北京  

编者荐语:



近年来虚拟数字人技术发展迅速,成为多个行业备受关注的热点。Unity作为业界领先的实时3D内容创作平台,其高清渲染管线HDRP为虚拟数字人制作提供了强大的技术支持。本文将深入探讨HDRP的技术特点及其在虚拟数字人制作中的实践应用,以期为业界同仁提供有益参考。


Unity HDPR虚拟数字人技术探索与实践
亚信科技(中国)有限公司
摘要本文围绕Unity HDRP在虚拟数字人制作中的应用展开探讨,重点阐述基于HDRP的虚拟数字人资产制作流程,包括模型制作、骨骼绑定、动画制作和材质贴图优化等。并分析HDRP在实时渲染、高质量渲染以及表情动作捕捉等方面的应用。最后结合展厅虚拟角色制作案例进行实践总结。

引言
(一)虚拟数字人的概念和发展历程

虚拟数字人是利用计算机图形学、人工智能、计算机视觉等前沿技术创建的数字化人物形象。从20世纪80年代的简单3D模型,到21世纪初电影中栩栩如生的数字角色,再到如今互联网上风靡的虚拟偶像,虚拟数字人经历了从概念探索到产业爆发的发展历程。尤其近年来,随着AI、5G、云计算等新技术的发展,虚拟数字人在影视制作、虚拟直播、数字营销等领域得到广泛应用,呈现出市场规模高速增长、产业链日益完善的发展态势。

图1:虚拟人市场规模


(二)Unity HDRP在虚拟数字人制作中的应用和优势

Unity是全球领先的实时内容创作平台,其高清渲染管线HDRP为虚拟数字人制作提供了先进的渲染功能和可扩展的工具集。基于物理的材质系统(Shader Graph)、复杂的光照模型(如次表面散射SSS)、运动模糊、体积雾等特性,使HDRP成为影视级数字人制作的理想选择。同时,HDRP与Unity完整的XR框架、Timeline动画系统、Burst编译器、ECS等模块无缝集成,极大提升了数字人的创作效率与实时性能。结合Unity强大的跨平台发布能力,虚拟数字人可快速应用于影视特效、虚拟偶像、VR/AR等多元场景。

本文将系统阐述Unity HDRP在虚拟数字人制作中的工作流程和技术应用。通过对模型制作、材质搭建、动画系统、渲染优化、XR交互等环节的详细分析,全面展示HDRP的功能优势及最佳实践。结合实际案例,探讨HDRP在不同应用场景下的性能表现及优化策略。在总结HDRP技术特点的同时,展望基于实时渲染的虚拟数字人技术的未来发展方向,为业界提供前瞻性思考。

Unity HDRP简介
(一)Unity引擎概述

Unity是由Unity Technologies开发的全球知名实时内容创作平台。它为创作者提供了强大的引擎架构和灵活的工具链,可快速搭建2D/3D场景,并一键发布至PC、移动设备、游戏主机、VR/AR头显、Web等多个平台。凭借其卓越的开发效率、稳定的性能表现和丰富的资源生态,Unity在游戏、影视、建筑、汽车等行业得到广泛应用。

(二)HDRP介绍

HDRP(High Definition Render Pipeline)是Unity专为高端平台推出的现代渲染管线,提供业界一流的视觉品质和渲染性能。区别于传统的前向渲染和延迟渲染,HDRP采用了基于物理的光照模型、线性颜色空间等先进理念,结合DXR实时光线追踪、体积雾、次表面散射等高端视觉效果,再现电影级画面质感。同时HDRP针对复杂场景做了深度优化,支持GPU Instancing、SRP Batcher、合批处理等加速技术,充分发挥现代GPU性能。基于可编程渲染管线,HDRP为开发者提供了灵活的自定义空间,可深度定制渲染流程和Shader表现,满足影视、游戏、建筑可视化等领域的高质量渲染需求。

图2:HDRP渲染效果


(三)HDRP与URP(Universal Render Pipeline)的比较

URP(Universal Render Pipeline)是Unity的通用渲染管线,以较低的开发成本提供优秀的渲染品质和性能,广泛适用于移动、Web、VR等资源受限平台。相比之下,HDRP面向高端设备,通过牺牲部分性能开销,实现电影级画面表现。在光照模型上,URP采用简化的光照算法,而HDRP使用基于物理的复杂光照,在后处理方面,HDRP提供更高质量的体积雾、景深、色差等效果。在自定义灵活性上,HDRP支持更细粒度的渲染控制。因此在虚拟数字人制作领域,HDRP凭借其顶尖的渲染能力和对电影级质感的追求,成为业界优先选择。

基于HDRP虚拟数字人资产制作
(一)模型制作


1. 基于人工智能生成式建模

在数字人形象制作中,首先使用stable diffusion人工智能生成算法,生成数字人三视图,然后基于三视图,在Blender中使用FaceBuilder,快速生成高精度的数字人模型。该算法通过深度学习网络,从大量人脸数据中习得人脸特征的内在映射关系,再根据输入的真人照片,生成符合人脸结构和纹理特征的三维模型。相比传统的手工建模,AI生成式建模在速度和真实感上具有显著优势。


2. 使用Blender对模型进行微调

获得初步模型后,我们使用Blender对其进行细节雕刻和拓扑优化。利用Blender强大的雕刻笔刷和网格工具,对毛发、皮肤细节进行精细修饰,并优化拓扑结构,生成适合实时渲染的低面数模型。通过人机结合,在保障效率的同时最大化提升建模精度。


(二)骨骼绑定和动画


角色的骨骼绑定是实现自然动画的关键。我们选用业界领先的Character Creator作为绑定工具。借助其人体骨骼标准模板(HumanIK),可快速为角色生成匹配的骨架并调整骨骼比例。同时利用其智能权重算法,自动计算精细的蒙皮权重,大幅减轻权重绘制的工作量。对于复杂的手部、面部细节,则通过权重绘制工具进行微调,确保变形正确自然。

(三)动画制作和编辑


在动画制作环节,我们综合运用动作库和手工调整的方式。通过动画曲线编辑、动作过渡融合、波形微调等手段,提升动画的平滑度和细腻度。


在唇形驱动方面,基于52键ARKit,还原真实的面部动作。使用Unity内置的BlendShape,将口型数据映射为虚拟角色的BlendShape系数,实现精细的表情控制。同时,我们还自研了表情修整插件,可对口型同步、眼睛运动等细节进行精调,使面部表情更加丰富生动。


图3:角色模型52键ARKit制作中


(四)材质贴图制作


1. 材质制作和优化

逼真的材质贴图是提升数字人真实感的关键。我们充分发挥HDRP的PBR材质系统,构建了一套基于物理参数的标准化材质制作流程。利用次表面散射(SSS)模拟光在皮肤内部的传播,再现皮肤的半透明质感。对于眼球材质,则采用了复杂的虹膜-晶状体-巩膜的分层构造,并加入IOR、泪液光泽等物理参数,逼真模拟眼球的湿润感。

2. HDRP渲染设置和优化

在贴图制作方面,我们以8K的超高分辨率制作角色的漫反射、法线、AO等贴图,全面还原肤质细节。基于HDRP贴图打包规则。经过细致入微的材质制作,数字人物的真实感得到极大提升。


图4:遮罩贴图的各个组成部分


图5:细节贴图的各个组成部分


Unity HDRP在虚拟数字人制作中的应用


(一)实时渲染和高质量渲染


1. 实时渲染技术

HDRP为虚拟数字人的实时高品质渲染提供了全方位支持。在实时渲染方面,我们采用了GPU Instancing、SRP Batcher等DrawCall合并技术,将数字人物与场景细节进行分组渲染,充分利用GPU并行能力。同时,我们基于Unity C# Job System和Burst编译器实现渲染逻辑的多线程优化,进一步提升帧率表现。针对光照,我们使用了Enlighten预计算GI方案,结合LPPVs、光照探针等技术,高效获取丰富的全局光照信息。同时,我们还开发了自适应Probe优化系统,根据物体的视觉重要度和运动状态,动态调整光照探针密度,在降低计算量的同时保障关键区域的光照质量。


2. 高质量渲染和光影效果

在画质提升方面,HDRP带来了诸多先进的后处理特效。我们采用了时间抗锯齿(TAA)算法,大幅改善画面的锯齿感,并柔化运动摩尔纹。体积雾效果则采用了逐体素光线步进算法,考虑雾与灯光的精确交互,塑造大气氛围。我们还引入次表面散射技术,模拟皮肤真实的散射-吸收过程,提升数字人的质感。通过对后处理管线的精细把控,我们实现了影视级画面呈现。


(二)虚拟数字人的唇形驱动和身体动作


1. 唇形驱动技术

在唇形匹配方面,我们开发了基于语音识别的唇形合成插件,根据音频自动生成匹配的口型动画,实现角色口型与配音的精准同步。


2. 肢体动作

在肢体动作方面,Animator Controller允许角色具备若干不同的动画,这些动画对应于该角色或对象可在对话中执行的不同动作。使用状态机来管理各种动画状态和它们之间的过渡。例如,角色可以在空闲时轻微呼吸或摇摆,在得到指令时进行手势等动作。

图6:Animator Controller


展厅虚拟数字人案例展示与分析

展厅虚拟数字人制作流程

展厅虚拟数字人定位为实时可交互的智能助手,形象方面采用3D写实,通过精确的建模、贴图和Unity HDRP渲染技术,呈现出非常逼真的外观,使观众感觉仿佛与真实人物面对面。互动方面,具备实时交互对话的能力,通过对话,介绍公司历程、产品体系、技术创新,战略架构等内容。

关于虚拟数字人的制作流程,大致分为三个阶段,建模、驱动、终端。

图7:展厅3D虚拟数字人制作流程


1. 建模

首先,3D设计师使用使用stable diffusion人工智能生成算法,生成数字人三视图概念稿。然后,基于三视图,在Blender中使用FaceBuilder快速完成头部模型生成,在生成的头模上,进行精细化雕刻,使形象自然生动。完成头模的制作后,使用Character Creator进行绑定及底模生成。使用Marvelous Designer进行角色服装打板,在Substance 3D Painter中完成服装贴图绘制。

图8:服装材质贴图绘制


最终在Blender中将所有模型资产合并绑定,并根据唇形驱动算法,完成形态键的制作。至此,一个完整的3D虚拟数字人角色资产就可以导入Unity进行开发了。


2. 驱动

项目初期,基于展厅数字人项目,定制了一套动作库。使用Animator Controller状态机,使数字人在不同状态时,根据不同的对话内容,做出相应的动作,通过对动画曲线的精修调整,使每个动作流畅衔接,从而达到生动逼真的效果。


唇形驱动属于一个技术难点,因为其涉及到TTS、ASR、BS、大模型等诸多技术方面的融合,其中任何一个环节出问题,就可能导致整个对话出错。对话驱动的大致流程为:ASR-内容处理-文本转音素-TTS-口型动画-参数调节和优化几个步骤。


· ASR:使用ASR将语音转换为文本,由于Unity本身可能没有内置的语音识别功能,这里主要通过引入第三方的语音识别API来实现。


· 内容处理:将识别到的文本发送到大模型,基于大模型或Chatbot,得到相应的答案。


· 文本转音素:将大模型返回的答案文本转换为音素序列。


· TTS:将大模型返回的答案文本转换为声音,同音素序列一起返回到Unity。


· 口型动画:在Unity中,使用Blend Shapes来实现口型动画。根据文本中的音素序列,将其映射到相应的BS动画序列,通过控制Blend Shapes来实现口型动画。


· 参数调节和优化:根据实际情况对系统进行调优,确保唇形驱动技术的性能和表现达到满意的水平。


图9:虚拟数字人-驱动效果


3. 终端

项目后期,考虑到效果和性能的平衡,采用打包PC文件(exe)的形式,部署在PC终端上,使用HDRP来打包PC平台的可执行文件(exe)有以下好处:


· 图形质量提升:HDRP提供了更高质量的图形渲染效果,包括更逼真的光影效果、更精细的材质贴图和更真实的渲染效果。这可以提升画面的视觉质量,使其更加引人注目。

· 视觉逼真度增强:HDRP支持现代渲染技术,如实时全局光照、体积光、屏幕空间反射等,这些技术可以增强视觉逼真度,使场景更具真实感。

· 性能优化选项:HDRP提供了各种性能优化选项,可以根据目标硬件配置进行调整,以保持运行的流畅性,使用PC包,可以自由定制终端配置,以达到最好性能和效果。

· 未来发展潜力: HDRP是Unity未来图形渲染的重点发展方向之一,因此使用HDRP打包PC平台的可执行文件可以使项目保持与Unity最新技术的接轨,并且能够充分利用未来的图形渲染进步。


总结与展望
通过上述工作,可深刻体会到Unity HDRP在虚拟数字人制作中的独特优势。基于物理的渲染、表现力极强的材质系统、灵活可编程的渲染管线,再加上成熟的XR开发框架,使HDRP成为业内公认的数字人制作优选方案。依托Unity强大的跨平台性能,可以针对不同硬件特性灵活调优,快速将虚拟角色部署到各类终端,适配多元应用场景。

参考资料

[1] 千际投行.2024年中国虚拟数字人研究报告
[2] 2022 Unity 用户手册 2020.3 (LTS)

亚信科技新技术探索
亚信科技的ICT前沿技术观点与行业洞见。展现亚信新技术与产品行业实践成果。
 最新文章