阿里通义万相,AI视频生成尝鲜体验!
前言
江树和甲木在前段时间获得了通义万相的视频内测资格~
昨天测试了几个case,对于通义万相视频生成功能还是比较期待的!
尤其是视频生成里面直接加上配音这个功能,简直太赞了!😁
话不多说,直接进入正题~
亮点
免费畅享,无拘无束🚀
万相目前是免费的,且几乎没有任何使用限制的服务平台。对于广大内容创作者来说,这无疑是一个巨大的福音,意味着大家可以在没有经济负担的前提下尽情发挥自己的创造力。
当然,AI视频生成软件前期肯定都是免费的,到后期嘛...看情况~
所以小伙伴们抓紧时间预约排队!!
“通义APP 直接预约即可。[薅羊毛!]
内容即音效🎶,声画同步更生动
最让人眼前一亮的功能是,该平台可以根据用户提供的文本描述自动生成带有相应背景音乐或环境声音的视频作品。
图生视频,宇宙飞船飞行。
例如,在Prompt中加入“背景声音XXX”(如鸟叫声、敲击声等),就能得到一个既符合视觉想象又具备听觉享受的作品了。
下文视频是我加上:「亚洲女孩微笑,背景声音鸟叫声」直接生成。
这项特色功能极大地丰富了视频的表现力,让每一帧画面都更加鲜活起来。
灵感💡扩写,激发无限可能
面对创作时常常遇到的灵感枯竭问题,通义万相也给出了很好的解决方案——“灵感扩写”。
只需输入少量关键词或者简短句子,系统便能自动补充完整的故事框架及细节描写,为用户提供源源不断的创意支持。
这对于那些想要尝试新领域但又担心缺乏经验的朋友来说尤其有用。
比如,我输入一个“黑猴子耍棍花”,点击“灵感扩写”,直接生成长文描述。
(ps.没有找到好看的截图,封面配个羊驼吧...)
中国风🏮,古韵悠长
如果你对中国传统文化感兴趣的话,那么通义万相绝对是你的不二之选。它特别擅长于根据中文Prompt创造出充满东方美学元素的画面,并配以古典音乐作为点缀,营造出一种别具一格的艺术氛围。
待改进之处
当然,任何产品都不可能是完美的。以下几点则是我们在使用过程中发现的一些需要进一步完善的地方:
等待时间过长⏳
目前从提交任务到最终获得成品大约需要10-13分钟的时间,无法并发,最多支持3个任务队列,而且每次只能处理一项任务。希望未来能够缩短这个周期并增加并发处理能力。
所以导致,测得case并不多,还有一些等待生成过程中,失败的情况。。。
“灵感扩写”内容太多
虽然“灵感扩写”功能确实非常强大,但对于某些用户而言,过多的信息反而会造成选择困难症。
建议简化输出结果,只保留核心要素即可。
对于通义模型来说,太多的描述也有点处理不过来,感觉留个(主体+内容+镜头语言)就足够了。
敏感词审查🔍严
敏感词审查太严格了,为了保证内容安全,通义万相对含有特定词汇的内容进行了严格过滤。
非恶意性质的科幻类短视频,只要涉及到枪炮相关的。如果是图生视频,带枪的一般都不会通过审核。
如果文生视频,“手枪”,“射击”,“gun”,“shot”这些词都通不过审核(但是…可以找找近义词,偶尔能绕过)
或许可以考虑适当放宽标准或提供更多灵活变通的方式。
训练数据西方风
人物模型偏向西方风格,由于训练数据主要来源于海外资源,因此默认情况下生成的人物形象多呈现为外国人特征。
比如,我说「女孩,微笑」,自动生成一个欧美女孩在微笑。
此外,在处理复杂动作时还存在肢体错位(肢体问题还是硬伤,跳舞旋转舞前后不分,胳膊大腿脑袋均容易错位)等问题,期待后续版本中能够有所改善。
最后
由于时间限制,这里只给大家简单展示一点心得,分享下其它相关案例。
欢迎小伙伴们留言评论说出你的体感~~
LangGPT 知识库提示词合集链接(持续更新):https://langgptai.feishu.cn/wiki/K4mxw5NJNiwzDHk6OUicYKhInm6
大家多多一键三连:点赞、转发、在看和评论啊啊啊啊!
“通义链接:https://tongyi.aliyun.com/wanxiang/videoCreation