我直接出手!开源最强数字人Hallo2,拿下!

2024-10-24 21:32   广东  

大家好,我是立志替大家出手的AI区(说出手,就出手)UP主Glen

在这个AI的时代,一张静态的照片都能被AI赋予生命,仿佛被施了魔法一般。今天呢,我要给大家分享一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学联手打造的AI对口型肖像图像动画技术——Hallo2

这个技术,就像是给静态图片打了一针“动起来”的兴奋剂,让它们根据你的语音音频,生成一个逼真且动态的视频。你只需要提供一张图片和你的声音,Hallo就能给你变出一个会说话的“自己”,而且……

今天还是老规矩,直接替大家出手,分享一个Hallo2一键整合包


Hallo2简介

在视频游戏、虚拟现实、电影电视制作、社交媒体和数字营销等领域,肖像图像动画技术一直是个大热门。但是,传统的方法是通过参数化模型来生成说话的人像,这就像是让一个机器人去模仿人类的表情和动作,总是感觉差那么点意思。

而Hallo2的出现,可能会改变这一切!Hallo这个端到端模型,就像是个魔术师,直接从声音驱动生成视频,无需复杂的参数化中间表示和额外的动作输入。它采用了分层音频驱动的视觉合成模块,通过分层交叉注意力操作,让嘴唇、面部和头部的动作更加自然丰富。

技术架构:

Hallo的网络架构整合了各种高科技元素,包括基于扩散的生成模型、基于UNet的去噪器、时间对齐技术和参考网络,这些都是为了让动画的质量和真实感更上一层楼。

  1. 全局运动可控性:Hallo利用分层面部特征注意力机制,能针对性地控制口型、表情和动作的运动强度,大幅提升人脸动画生成的可控性。
  2. 应用前景:从影视制作到游戏与虚拟现实,再到教育领域,Hallo都能大显身手。它不仅能提高制作效率,还能实现更高质量的动画效果,增强用户的沉浸感和参与感。

离线懒人包来了

老规矩,大家自行在本地部署比较麻烦,(无所谓,我会出手.jpg),我已经为大家制作好了一款一键整合包了,下载到本地解压即用。

大家下载解压到本地后,双击“一键启动.exe”,项目会自动打开浏览器运行。如果没有自动打开浏览器,请自行复制网址“http://127.0.0.1:7860/”在浏览器打开,系统就会自动运行并打开一个简单的用户界面。

使用教程:

上传素材图片,上传素材音频,可以自由调节参数,点击“立即运行”按钮。稍等片刻,该工具会根据我们提供的素材,来生成数字人视频啦~以下是实测生成的视频,效果还是蛮不错的,感兴趣的朋友,可以下载试试~

注意事项:

①显卡要求:建议使用至少10GB显存的英伟达显卡,而且建议把上传的音频拆分到3秒一下,以减少生成时间。

②软件路径、图片和视频文件的名称和路径都不能包含中文,不然可能会出错。另外,计算机系统的用户名也不要设置成中文,不然也可能会出现问题。

③系统要求:支持Windows 10和Windows 11。

今天就聊到这了,我是Glen,感谢你看我的内容,欢迎大家继续支持我,请点赞、收藏、分享三连走一波吧~

免费整合包

“赞”+“在看”支持我

复制关键词Hallo2下载

点击关注👇️,后台回复

推荐阅读

Glen
关注我,免费领AI整合包合集。我是Glen,原鹅厂、字节高级产品经理,现AI公司创始人。让一部分人,看见AI并连接。分享人工智能、互联网、商业、职场等内容,管理精力,提升认知。种一棵树最好的时机是十年前,其次是现在!
 最新文章