大家好,我是立志替大家出手的AI区(说出手,就出手)UP主Glen。
在这个AI的时代,一张静态的照片都能被AI赋予生命,仿佛被施了魔法一般。今天呢,我要给大家分享一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学联手打造的AI对口型肖像图像动画技术——Hallo2。
这个技术,就像是给静态图片打了一针“动起来”的兴奋剂,让它们根据你的语音音频,生成一个逼真且动态的视频。你只需要提供一张图片和你的声音,Hallo就能给你变出一个会说话的“自己”,而且……
今天还是老规矩,直接替大家出手,分享一个Hallo2一键整合包。
Hallo2简介
在视频游戏、虚拟现实、电影电视制作、社交媒体和数字营销等领域,肖像图像动画技术一直是个大热门。但是,传统的方法是通过参数化模型来生成说话的人像,这就像是让一个机器人去模仿人类的表情和动作,总是感觉差那么点意思。
而Hallo2的出现,可能会改变这一切!Hallo这个端到端模型,就像是个魔术师,直接从声音驱动生成视频,无需复杂的参数化中间表示和额外的动作输入。它采用了分层音频驱动的视觉合成模块,通过分层交叉注意力操作,让嘴唇、面部和头部的动作更加自然丰富。
技术架构:
Hallo的网络架构整合了各种高科技元素,包括基于扩散的生成模型、基于UNet的去噪器、时间对齐技术和参考网络,这些都是为了让动画的质量和真实感更上一层楼。
全局运动可控性:Hallo利用分层面部特征注意力机制,能针对性地控制口型、表情和动作的运动强度,大幅提升人脸动画生成的可控性。 应用前景:从影视制作到游戏与虚拟现实,再到教育领域,Hallo都能大显身手。它不仅能提高制作效率,还能实现更高质量的动画效果,增强用户的沉浸感和参与感。
离线懒人包来了
老规矩,大家自行在本地部署比较麻烦,(无所谓,我会出手.jpg),我已经为大家制作好了一款一键整合包了,下载到本地解压即用。
大家下载解压到本地后,双击“一键启动.exe”,项目会自动打开浏览器运行。如果没有自动打开浏览器,请自行复制网址“http://127.0.0.1:7860/”在浏览器打开,系统就会自动运行并打开一个简单的用户界面。
使用教程:
上传素材图片,上传素材音频,可以自由调节参数,点击“立即运行”按钮。稍等片刻,该工具会根据我们提供的素材,来生成数字人视频啦~以下是实测生成的视频,效果还是蛮不错的,感兴趣的朋友,可以下载试试~
注意事项:
①显卡要求:建议使用至少10GB显存的英伟达显卡,而且建议把上传的音频拆分到3秒一下,以减少生成时间。
②软件路径、图片和视频文件的名称和路径都不能包含中文,不然可能会出错。另外,计算机系统的用户名也不要设置成中文,不然也可能会出现问题。
③系统要求:支持Windows 10和Windows 11。
今天就聊到这了,我是Glen,感谢你看我的内容,欢迎大家继续支持我,请点赞、收藏、分享三连走一波吧~
免费整合包
复制关键词【Hallo2下载】
推荐阅读