即梦AI:让古人“照片说话”,以假乱真,情境感极强!

百科   2024-09-30 10:47   重庆  

AI是知识工作者的挖掘机,大幅提升教学与科研生产力。

————————————————

照片说话,对于教学情境营造来说,是非常有价值的。

如果能让知识的发明者、或者课文的作者,“自己”站出来说几句话,一定会对学生产生强烈的情感震撼效果!

照片说话,从技术上至少一年前就有了,虽说口型对得差不多,但是普遍表情比较呆板,而且相当模式化,看上去有点假。


【引子】

9月初,王珏老师看到了字节跳动开发的loopy语音驱动的“照片说话”模型,效果非常逼真、难以区分真假:



,时长01:0而且,loopy还支持设置人脸表情与动作的不同“生动程度”,如下:

在上面的视频中,泰勒说话时候的眼部以及颈部的动作都非常自然,让我们觉得她说话的时候就是这个样子的。

甚至对于兵马俑这样的非现实人物,LOOPY也表现惊艳。无论是歌手演唱时的细腻表情,还是与情绪同步的眉眼变化,甚至是一声轻柔的叹息,LOOPY都能完美呈现。

可惜的是,loopy只是个开源的工具包,并不是直接可用的网络服务。王珏老师感到非常惋惜,并强烈希望哪个大模型公司能赶紧把这项技术用上,造福大家。


仅仅半个月过后,9月下旬,同是字节旗下的即梦AI就宣布提供“照片说话”的功能了——果然是“近水楼头先得月”呀!
这项技术,王珏老师已经在《AI时代教师必备技能》网络课程中(即将上线)已经用上了,由古人现身直接跟王珏老师对话,效果是不是相当wasai呢?!

那么,这样的“照片说话”视频如何制作呢?

【操作方法】
首先,进入即梦AI网址:https://jimeng.jianying.com
然后点击“AI视频-->“视频生成”

然后进入“对口型”,上传一张人物照片:

在声音方面,有两种方法可以配音:

【配音方法1】

选择“文本朗读”、并输入一段文本,然后选择一个音色(如果您对剪映熟悉的话,就会发现其中的音色和剪映基本相同,还是比较丰富的):


【配音方法2】

如果我们有声音素材(比如名家的朗诵音频、电视剧电影歌曲中的人声、或其它AI生成的配音),那么直接选择“上传本地音频”即可:


最后,还可以选择一下“生成效果”,目前提供“标准”、“生动”两种。

前者脸部动作、表情比较平稳,后者动作更大、更夸张一些。

最后点击“生成视频”即可,一般一两分钟即可生成。

当然,在即梦中生成图像、视频都需要积分。像这种文字配音性质的,一般消耗的积分比较少(比如上例中需要消耗5积分)。

那么,积分是怎么获得的呢?——除了充值外,即梦AI会贴心地每天给用户送80积分,只需每天登录一次即可得到。


【示例】

以下是用“文本+配音”模式生成的爱因斯坦“想象力比知识更重要”的讲话,标准模式:

以下是生动模式:


以下是用“配音朗读音频模式”生成的杜甫“登高”,标准模式:

以下是“生动” 模式(换了一张照片,一般而言照片最好是“正脸”,经实测略侧一点也可以,不过这种情况下似乎只能选“生动模式”,而且可能会有些变形):


以上操作是不是已经足够简单,门槛足够低,效果相当逼真?

用得好的话,真的有可能引爆课堂!

只是不知道对您有用不?

——————————————


师生成长
关注教师发展,关心学生成长,干货索引,共同学习。我们一起进步!
 最新文章