一笔生成运动轨迹！阿里版“Sore”视频生成框架Tora开源

情感 2024-08-07 17:07 重庆

在AI视频生成领域，今年以来多家人工智能公司陆续发布了研发的大模型以及在大模型基础上推出产品，但在精度、遵守指令的能力以及效率等方面仍然还有精进的空间。

基于AI生成内容的强随机性，许多玩家将获得满意结果的过程称之为“抽卡”，而减少用户抽卡的次数则是大模型公司研究的重点方向。

近日，阿里巴巴团队开源了一款AI视频生成框架-Tora，是AI视频内容创作领域的新突破，给提升文生视频的准确度展示了一个新方向。

Tora将轨迹导向的DiT用于视频生成的应用，通过这项技术，Tora能够很好地将文本、视觉和轨迹条件融合，生成高质量且符合物理世界动态的视频内容。

在使用Tora时，用户可通过输入描述性的文本并设置生成视频中物体运动轨迹等简单操作共同控制最终视频的效果，从而实现快速制作满意的视频，降低“抽卡”次数。

在原理上，Tora基于OpenSora模型，包含一个轨迹提取器 (TE，Trajectory Extractor)、时空DiT（Spatial-Temporal DiT）和一个运动引导融合器 (MGF，Motion-guidance Fuser) 。TE使用3D视频压缩网络将任意轨迹编码为分层时空运动patch，MGF将运动patch集成到DiT块中，以生成遵循轨迹的一致视频。

Tora框架支持生成最长可达204帧、720P分辨率的视频，这一特性赋予用户在视频时长、宽高比及分辨率上的高度灵活性，也确保视频内容的精细控制与高质量输出。

两个人在晴朗的天空下沿着高速公路平稳地骑车

通过大量实验验证，Tora在FVD、CLIPSIM和TrajError等多个标准评测指标上表现出色，其在视频生成质量和运动控制方面性能卓越。

目前，Tora主页主要提供视频效果演示，用户可通过访问相关链接来了解和体验Tora的功能，但直接的下载或试用入口此次并未公布。

基于优秀的呈现效果，Tora的应用前景十分广阔，未来可能会在广告、电影、教育等多个领域发挥重要作用。

今年以来，AI视频生成获得了突破性进展。此前的视频生成技术受限于传统U-Net去噪模型，大多只能生成16帧长度、固定低分辨率的视频，不仅难以应对长距离轨迹，在不规则轨迹以及偏移过大时，还会出现运动模糊、外观失真和不自然的运动如漂移闪现等现象。

而Diffusion扩散模型就能够很好地解决这些问题，采用Diffusion Transformer（DiT）架构的模型诸如sora显示，其不仅能制作10到60秒的高质量视频，而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。

随着国内外AI机构对文生视频、图生视频等多方面的开拓以及新模型的涌入，相信下半年这些领域还有更多的惊喜等待着我们。

文字、图片、视频来源于Tora网站、媒体等

END

商界BIZTECH

http://mp.weixin.qq.com/s?__biz=MjM5MTg5ODAyMQ==&mid=2652150735&idx=1&sn=c508e0d34004887268ccba6375238270

商界BIZTECH

打造新科创第一媒体做AI场景应用领航者

最新文章

拿下国内第一！这家初创大模型公司终于不再低调

AI超级应用第二战场：陪伴型产品的潜力与边界

最全！这些国内eVTOL亮相第十五届中国航展

最复杂多智能体发布！百度推出“秒哒”和文心iRAG

资本涌入、基金成立，低空经济成2024年最大黑马

跨界涌入人形机器人？做充电宝的、空调的都来了

具身智能中场思考：人形机器人要多像人？

仅重25KG，国内首台超轻量级人形机器人问世！

AI也能像人一样玩手机？智谱AI推出自主智能体AutoGLM

商业航空风口来临！太空旅行船票首次公开售卖

对话|久尺网络胡建强：长期看算力应与终端分离，未来更宜放云上

强联智创®完成亿元D+轮融资，加速推动医药健康产业高质量发展

对话|帕西尼许晋诚：未来的人形机器人也会疼

百亿基金成立！AI融资热度不减，国内外持续加码

“筷子夹火箭” ，SpaceX星舰首次回收成功

AI再夺诺奖！2024年诺贝尔化学奖也颁给人工智能

2024年诺贝尔物理学奖揭晓！AI教父获奖

填补空白！我国首次成功点亮硅基芯片内部激光光源

对话|星海图高继扬：打造“一脑多形”的具身智能机器人

对话|蓝驰创投曹巍：机器人公司要做有一技之长的“六边形战士”

AI＋家用、商用清洁机器人，下一个蓝海市场！

专访钛虎易港：人形机器人商用元年即将来临！

见证历史！人类首次商业太空行走

专访李青阳：“人工智能＋”时代，数智化赋能产业升级

首个AI大模型供应链安全国际标准发布，蚂蚁、谷歌、百度参与编制

飞行汽车、人形机器人、……这些AI产品亮相外滩大会！

英伟达被美国司法部反垄断调查？最新回应来了！

研学| 抓住“新”制造风口，跑出行业“加速度”

AI＋教育，重塑有教无类范式

大咖云集！机器人创投论坛观点集锦来啦！附中国最具投资潜力机器人公司TOP20名单

一文了解：这些机器人亮相2024年世界机器人大会

反AI产品GPT Zero火了，6个月狂涨300万用户

2024世界机器人大会，倒计时5天开幕！

Open AI官宣GPT-4o上热搜，透露草莓计划进度

AI机器人下单MONA？小鹏官宣机器人最新进展

盘点医疗领域AI大模型：百度、百川智能、讯飞、商汤科技押宝

一笔生成运动轨迹！阿里版“Sore”视频生成框架Tora开源

360与15家AI搜索公司大联合！掰腕GPT-4o

京东云力推8大AI产品，打通大模型最后一公里

蔚来加码AI！5nm芯片、整车全域操作系统赋能智驾

智谱AI推出视频生成模型CogVideoX，30秒即可生成6秒视频

强联智创携AI医疗创新成果亮相2024中关村论坛

新质生产力按下“快进键”，半导体产业发展该走向何方？

商界科创 | 资讯简报

签约！商界科创又与两家重要伙伴牵手

【今日直播预告】2024英伟达GTC见闻与趋势漫谈

【直播预告】2024英伟达GTC见闻与趋势漫谈

商界科创助力强联智创® 赋能科创AI传播新动力

首个面向科创企业的AI传播应用解决方案发布 | 商界科创2024新知TALK昨在上海圆满举行

D轮融资达近亿元，强联智创®为何频获资本青睐?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉