近期,AI 做视频的风口起来了
出现了很多优秀的软件,一些效果已经达到商业级别
今天就和大家聊聊视频 AI 软件,推荐软件列表见后文
建议收藏本公众号
一、AI 视频常识
什么是 AI 做视频?
视频融合了文本、语音、图像等多维度内容
“AI 做视频”指的是利用 AI 技术,完成视频创作的各个环节,包括:选题、脚本创作、分镜设计、视频生成、不同角度摄制、特效、配音配乐等。
生成式 AI 视频的发展阶段
目前主流的视频 AI 都属于生成式 AI
在经历了文生文、文生图的多次升级迭代后,我们正处在 AI+生产力办公与设计、AI+视频以及 AI+3D 逐步渗透的关键历史节点上
1.0 时代:Transformer 阶段(2023 年 2 月前)
此阶段的视频 AI 仍处于实验室阶段,主要是基于 Transformer 模型生成文本或图像,尚未有实用的视频 AI 产品。
2.0 时代:扩散模型阶段(2023 年 2 月 - 2024 年 2 月)
代表产品包括:Runway Gen1、Pika 1.0、SVD 1 等。虽然基于 Diffusion 扩散模型的视频 AI 可以开始创作,但视频效果仍有较强的“塑料感”。
3.0 时代:DiT 阶段(2024 年 2 月至今)
OpenAI 结合 Transformer 和 Diffusion,推出了 DiT 技术架构,并宣布推出 Sora 视频 AI 大模型,其他厂商也纷纷跟进。目前市面上的主流视频 AI 大多基于此技术。
AI 做视频的方式包括文生视频,图生视频,视频生视频
技术突破与难点
一个好的视频 AI:算法、算力、高质量训练数据缺一不可
需要完善项如下:
主体的连续性和融合性:保证同一个主体在不同镜头切换中形象一致,特别是再次进入画面时的形象稳定性。
同时需要在多个主体之间实现快速融合,并确保独立和连续性
有两种解决思路:主路模式是 lora 微调,比如可灵正在内测的定制主体功能(给 10 个短视频完成微调);第二种是清华 vidu1.5 的“多图参考生成视频”模式
物理合理性:避免不符合物理常识的画面,例如人物穿透物体或脚踩瓷器不碎的情况
时间长度:当前 AI 一次性能生成的视频多为 4-12 秒,超过此长度后,画面质量会明显下降
可控性:更好地控制镜头运动及视频内容,包括主体的动作轨迹、情绪表情等,使得按需修改更为便捷
易用性:让普通小白用户也能轻松创作商业级视频,目前仍需多个工具配合,操作较为繁琐
其他:版权、伦理、安全,生成速度、清晰度、实时处理以及根据视频自动生成音效等问题
二、常见 AI 视频软件
先给大家看一个案例,近期比较火的人工智能杀人事件
注意最后的软件列表
视频是一个综合性成果,选题、脚本创作、分镜设计、视频生成、不同角度摄制、特效、配音配乐等。
(一)选赛道
你可以选视频号变现,也可以选沙雕动画,后期我们会介绍新闻播报、广告和影视制作
(二)选主题
选一个自己熟悉的主题
选对标账号和内容可以到定期到新榜去看看:www.newrank.cn
(三)写剧本
脚本主要是利用 AI 大模型创作,需要结合提示词
ChatGPT:chatgpt.com
Claude:claude.ai
kimi:kimi.moonshot.cn
(四)视频分析
geimin1.5:目前唯一一个好用的视频分析,可以逐帧分析视频提示词 aistudio.google.com
抓帧:Ezgif ezgif.com/video-to-jpg
(五)图片生成
图生视频是目前最可控的方式
也可以画分镜设计
Flux:glif.app,可免费生成 fux pro1.1 ultra
即梦 AI、可灵:做图功能
krea:krea.ai
灵犀(国内 midjourney):www.eqmj.cc
哩布哩布:www.liblib.art
DALL-E3:集成在 chatgpt plus 里面
Ideogram AI:ideogram.ai,可生成 IP 人物
(六)视频 AI
海螺视频 AI 视频:hailuoai.com/video
快手的可灵 AI:klingai.kuaishou.com
字节跳动即梦: dreamina.jianying.com
爱诗科技的 PixVerse: app.pixverse.ai
生数科技的 Vidu: www.vidu.studio
智谱清影:chatglm.cn/video
国外:
OpenAI Sora:sora.openai.com
Luma AI Dream Machine:lumalabs.ai/dream-machine
Runway 的 Gen-3:app.runwayml.com
Pika:pika.art
Stable Video Diffusion:stability.ai/stable-video
(七)语音克隆
fish tts(可以克隆语音):fish.audio
睿声科技网站(可以克隆语音):www.reecho.cn
Elevenlabs AI 生成语音:try.elevenlabs.io
chattts:chattts.com(非官方)
(八)配乐
suno: www.suno.ai
天工:www.tiangong.cn
(九)其他辅助
无版权音效:pixabay.com
图片高清:krea.com
抠图:remove.bg 或即梦的画布
(十)数字人
dreamface、众影、蝉镜、讯飞智作、即创、hengen 等
(十一)剪辑合成
剪映、万兴喵影、智影在线剪辑 zenvideo.qq.com
那个视频效果最好?X 平台(原推特)上,全球网友公认是海螺 AI!
学习 AI 做视频正当其时
如果你是影视业有关人士,可以用 AI 拓展你的专业边际;如果你是专业人士,可以用 AI 快速完成短视频制作,辅助业务拓展和日常宣传;如果你是短视频博主,可以利用 AI 创作创意视频,引流变现
可以看到 AI 视频领域几乎 1-2 个月就会更迭一个重大新技术 因为技术在进步,功能在完善,但也是这种技术迭代才造就了红利期,就像 2021 年的抖音,只要你躬身入局,不下桌面,那么一定能够获得属于自己的一份羹。
早三个月入场,还没有这么多好工具;晚三个月入场,可能就错过了最佳的机会
行动起来,抓住“生成式 AI + 视频”的风口!把握这几个月,苦练 AI+视频的技能,找到商业模式、实现快速变现,才是当下最重要的选择
后面更多更好的软件出现后,我们也可以快人一步,先入为主!
跟着清风,让咱们一起在 AI 视频创作的浪潮中扬帆起航! ⛵️
记得点击关注,下期继续为大家带来更多 AI 视频制作干货!
对视频 AI 感兴趣的小伙伴可以关注“手把手教你用AI做视频赚钱”小报童!
这个频道日更!分享了很多 AIGC 的知识和最前沿的实操案例、工具、提示词。
原价 299,买断优惠推广价 19元!