首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

智谱AI推出视频生成模型CogVideoX，30秒即可生成6秒视频

情感 2024-07-26 19:54 重庆

点击蓝字关注我们

二十届三中全会公报中，新质生产力的重要性被再次提及。作为新质生产力的关键驱动，人工智能发展的深度和广度，成为新质生产力现阶段乃至未来发展的重要指标。

目前，我国人工智能机构发展呈现百花齐放、百家争鸣的态势，一批先行者正在通过对数据、算力以及算法等多方面的开发探索，将人工智能技术场景化运用。

7月26日上午，智谱AI全新升级视频生成模型，推出了新一代产品——CogVideoX。

相较于传统视频生成模型，CogVideoX不仅具有快速生成、高效的指令遵循能力、内容连贯性、画面调度灵活性等特点，还在提升用户使用舒适度同时，支持文生视频和图生视频等多种方式。

视频制作方面，CogVideoX仅需30秒即可完成6秒视频生成，相较于同类型应用，效率显著提升。

针对视频生成模型内容连贯性痛点，智谱AI自主研发了一套高效的三维变分自编码器结构（3D VAE）。

该结构能够将原始视频数据压缩至原始大小的2%，显著降低了视频扩散生成模型的训练成本和难度。结合3D RoPE位置编码模块，该技术有效提升了在时间维度上对帧间关系的捕捉能力，从而建立了视频中的长期依赖关系。

做得快是基础，做得准才是关键。对于指令的理解，智谱AI还为CogVideoX打造了一款端到端的视频理解模型。

该模型能够为大量视频数据生成精确且内容相关的描述。这一创新增强了模型对文本的理解和对指令的遵循能力，确保生成的视频更加符合用户的输入需求，并能够处理超长且复杂的prompt指令，还原物理世界中的运动过程。

Prompt：写实描绘，近距离，猎豹卧在地上睡觉，身体微微起伏

CogVideoX的模型采用了一种将文本、时间、空间三维一体融合的transformer架构。该架构摒弃了传统的cross attention模块，设计了Expert Block以实现文本与视频两种不同模态空间的对齐，并通过Full Attention机制优化模态间的交互效果。

据悉，自2021年起，智谱AI技术团队着手布局包括 text-2-img、text-2-video、img-2-text、video-2-text在内的多模态模型，并陆续研发并开源了CogView、CogVideo、Relay Diffusion、CogVLM、CogVLM-Video等多个模型。

目前，CogVideoX已向所有用户开放。用户可在智谱清言的PC端、移动应用端以及小程序端免费体验智谱清言的AI视频生成功能「清影」（Ying）。企业和开发者也可通过API调用方式，在智谱大模型开放平台bigmodel.cn，体验并使用文本生成视频和图像生成视频功能。

END

商界BIZTECH

http://mp.weixin.qq.com/s?__biz=MjM5MTg5ODAyMQ==&mid=2652150539&idx=1&sn=b79e31d285c932e91c392f51d8fd4fd9

打造新科创第一媒体做AI场景应用领航者

最新文章

拿下国内第一！这家初创大模型公司终于不再低调

AI超级应用第二战场：陪伴型产品的潜力与边界

最全！这些国内eVTOL亮相第十五届中国航展

最复杂多智能体发布！百度推出“秒哒”和文心iRAG

资本涌入、基金成立，低空经济成2024年最大黑马

跨界涌入人形机器人？做充电宝的、空调的都来了

具身智能中场思考：人形机器人要多像人？

仅重25KG，国内首台超轻量级人形机器人问世！

AI也能像人一样玩手机？智谱AI推出自主智能体AutoGLM

商业航空风口来临！太空旅行船票首次公开售卖

对话|久尺网络胡建强：长期看算力应与终端分离，未来更宜放云上

强联智创®完成亿元D+轮融资，加速推动医药健康产业高质量发展

对话|帕西尼许晋诚：未来的人形机器人也会疼

百亿基金成立！AI融资热度不减，国内外持续加码

“筷子夹火箭” ，SpaceX星舰首次回收成功

AI再夺诺奖！2024年诺贝尔化学奖也颁给人工智能

2024年诺贝尔物理学奖揭晓！AI教父获奖

填补空白！我国首次成功点亮硅基芯片内部激光光源

对话|星海图高继扬：打造“一脑多形”的具身智能机器人

对话|蓝驰创投曹巍：机器人公司要做有一技之长的“六边形战士”

AI＋家用、商用清洁机器人，下一个蓝海市场！

专访钛虎易港：人形机器人商用元年即将来临！

见证历史！人类首次商业太空行走

专访李青阳：“人工智能＋”时代，数智化赋能产业升级

首个AI大模型供应链安全国际标准发布，蚂蚁、谷歌、百度参与编制

飞行汽车、人形机器人、……这些AI产品亮相外滩大会！

英伟达被美国司法部反垄断调查？最新回应来了！

研学| 抓住“新”制造风口，跑出行业“加速度”

AI＋教育，重塑有教无类范式

大咖云集！机器人创投论坛观点集锦来啦！附中国最具投资潜力机器人公司TOP20名单

一文了解：这些机器人亮相2024年世界机器人大会

反AI产品GPT Zero火了，6个月狂涨300万用户

2024世界机器人大会，倒计时5天开幕！

Open AI官宣GPT-4o上热搜，透露草莓计划进度

AI机器人下单MONA？小鹏官宣机器人最新进展

盘点医疗领域AI大模型：百度、百川智能、讯飞、商汤科技押宝

一笔生成运动轨迹！阿里版“Sore”视频生成框架Tora开源

360与15家AI搜索公司大联合！掰腕GPT-4o

京东云力推8大AI产品，打通大模型最后一公里

蔚来加码AI！5nm芯片、整车全域操作系统赋能智驾

智谱AI推出视频生成模型CogVideoX，30秒即可生成6秒视频

强联智创携AI医疗创新成果亮相2024中关村论坛

新质生产力按下“快进键”，半导体产业发展该走向何方？

商界科创 | 资讯简报

签约！商界科创又与两家重要伙伴牵手

【今日直播预告】2024英伟达GTC见闻与趋势漫谈

【直播预告】2024英伟达GTC见闻与趋势漫谈

商界科创助力强联智创® 赋能科创AI传播新动力

首个面向科创企业的AI传播应用解决方案发布 | 商界科创2024新知TALK昨在上海圆满举行

D轮融资达近亿元，强联智创®为何频获资本青睐?

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉