AI是知识工作者的挖掘机,大幅提升教学与科研生产力。
————————————————
照片说话,对于教学情境营造来说,是非常有价值的。
如果能让知识的发明者、或者课文的作者,“自己”站出来说几句话,一定会对学生产生强烈的情感震撼效果!
照片说话,从技术上至少一年前就有了,虽说口型对得差不多,但是普遍表情比较呆板,而且相当模式化,看上去有点假。
【引子】
9月初,王珏老师看到了字节跳动开发的loopy语音驱动的“照片说话”模型,效果非常逼真、难以区分真假:
01:0而且,loopy还支持设置人脸表情与动作的不同“生动程度”,如下:
在上面的视频中,泰勒说话时候的眼部以及颈部的动作都非常自然,让我们觉得她说话的时候就是这个样子的。
甚至对于兵马俑这样的非现实人物,LOOPY也表现惊艳。无论是歌手演唱时的细腻表情,还是与情绪同步的眉眼变化,甚至是一声轻柔的叹息,LOOPY都能完美呈现。
可惜的是,loopy只是个开源的工具包,并不是直接可用的网络服务。王珏老师感到非常惋惜,并强烈希望哪个大模型公司能赶紧把这项技术用上,造福大家。
然后进入“对口型”,上传一张人物照片:
在声音方面,有两种方法可以配音:
【配音方法1】
选择“文本朗读”、并输入一段文本,然后选择一个音色(如果您对剪映熟悉的话,就会发现其中的音色和剪映基本相同,还是比较丰富的):
【配音方法2】
如果我们有声音素材(比如名家的朗诵音频、电视剧电影歌曲中的人声、或其它AI生成的配音),那么直接选择“上传本地音频”即可:
最后,还可以选择一下“生成效果”,目前提供“标准”、“生动”两种。
前者脸部动作、表情比较平稳,后者动作更大、更夸张一些。
最后点击“生成视频”即可,一般一两分钟即可生成。
当然,在即梦中生成图像、视频都需要积分。像这种文字配音性质的,一般消耗的积分比较少(比如上例中需要消耗5积分)。
那么,积分是怎么获得的呢?——除了充值外,即梦AI会贴心地每天给用户送80积分,只需每天登录一次即可得到。
【示例】
以下是用“文本+配音”模式生成的爱因斯坦“想象力比知识更重要”的讲话,标准模式:
以下是生动模式:
以下是用“配音朗读音频模式”生成的杜甫“登高”,标准模式:
以下是“生动” 模式(换了一张照片,一般而言照片最好是“正脸”,经实测略侧一点也可以,不过这种情况下似乎只能选“生动模式”,而且可能会有些变形):
以上操作是不是已经足够简单,门槛足够低,效果相当逼真?
用得好的话,真的有可能引爆课堂!
只是不知道对您有用不?
——————————————