腾讯混元正式上线文生视频并全面开源，为当前最大视频开源模型

财富 2024-12-04 11:49 上海

“腾讯混元系列大模型至此已实现全面开源，此前已开源文生文、文生图和3D生成大模型。”

作者：苏打

编辑：tuya

出品：财经涂鸦（ID：caijingtuya）

公司情报专家《财经涂鸦》获悉，12月3日，腾讯混元大模型公布最新进展：正式上线视频生成能力，这是继文生文、文生图、3D生成之后的又一新里程碑。与此同时，腾讯开源该视频生成大模型，参数量130亿，是当前最大的视频开源模型。

“用户只需要输入一段描述，即可生成视频，”腾讯混元相关负责人透露，目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。目前该模型已上线腾讯元宝APP，用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入，目前API同步开放内测申请。

在与国内外多个顶尖模型的评测对比显示，混元视频生成模型以41.3%的总体评分排名第一，在文本视频一致性、运动质量和画面质量多个维度效果领先，在人物、人造场所等场景下表现尤为出色。

该大模型可以实现超写实画质、生成高度符合提示词的视频画面，画面流畅不易变形。比如，在冲浪、跳舞等大幅度运动画面的生成中，腾讯混元可以生成非常流畅、合理的运动镜头，物体不易出现变形；光影反射基本符合物理规律，在镜面或者照镜子场景中，可以做到镜面内外动作一致。同时，模型还可以实现在画面主角保持不变的情况下自动切镜头，这是业界大部分模型所不具备的能力。

据悉，混元基于跟Sora类似的DiT架构，并在架构设计上进行多多处升级，视频生成模型适配了新一代文本编码器提升语义遵循，具备强大的语义跟随能力，更好地应对多个主体描绘，实现更加细致的指令和画面呈现；采用统一的全注意力机制，使得每帧视频的衔接更为流畅，并能实现主体一致的多视角镜头切换；通过先进的图像视频混合VAE（3D 变分编码器），让模型在细节表现有明显提升，特别是小人脸、高速镜头等场景。

腾讯混元视频生成模型画面具备高质感，可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。此前，《人民日报》、央视网、新华社、《21世纪经济报道》、重庆卫视、《羊城晚报》、《南方都市报》等多家媒体，已经率先将腾讯混元视频生成能力用于创意视频制作，制作了《江山如此多娇》、《山水之间》等多部作品。

目前，腾讯宣布开源该视频生成大模型已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型，开发者及企业无需从头训练，即可直接用于推理，并可基于腾讯混元系列打造专属应用及服务，能够节约大量人力及算力，加速行业创新步伐。

从年初以来，腾讯混元系列模型的开源速度不断加快。此前，腾讯混元已经开源了旗下文生文、文生图和3D生成大模型。至此，腾讯混元系列大模型已实现全面开源。

本文由公众号财经涂鸦（ID：caijingtuya）原创撰写，如需转载请联系涂鸦君。

添加涂鸦君个人微信（ID：tuyaclub）
加入【公司情报社群】
参与资本市场讨论
获取一手情报

财经涂鸦

公司情报专家，关注账号获取一手情报

最新文章

腾讯宣布与荣耀达成战略合作，2022年时便已支持荣耀手机云业务100%全量上云

支付宝推出AI创意生成平台「蚂上有创意」，聚焦用AI让商业营销更简单

喜茶发布四季度合伙人公开信：今年门店业绩逆势增长，明年将推多项支持政策

土巴兔CEO王国彬：消费者决策永远按照价值排序，拥抱AI才能突出重围

豆包视觉理解模型发布：千Tokens输入价3厘，3D生成模型首次亮相

小猿学练机彩墨版聚焦低龄儿童，CEO王向东：教育大模型是「解决不同学段及个体复杂差异难题的最大机遇」

阿里巴巴作价74亿元出售银泰，雅戈尔回应称旨在「强链补链」，完善时尚生态圈

沃尔玛中国门店全量入驻美团，双方将在生态系统层面展开多元化全面合作

脉脉高聘数据：非技术人才涌向海外，新能源汽车行业求职竞争加剧

李佳琦直播间「双十二」母婴节专场过半产品销量增长，国货和高质价比成主流

小马智行与广汽埃安将共研全冗余前装量产Robotaxi平台，计划车辆规模至少千台量级

商汤启动新一轮配售，预计将筹集28亿港元支持公司核心业务发展

甄云科技王佩：SaaS道路分化愈加严重，商机虽在减弱但「难题对优等生反而有利」

lululemon中国大陆Q3净营收增长39%，管理层称对大陆市场仍着眼于长期趋势

阡视科技软硬协同重新定义AI基础设施，加速推动国产替代「稳定好用」进程

商汤宣布分拆出汽车、机器人、医疗、零售四大生态企业，各自设立独立融资通道（附内部信全文）

腾讯混元正式上线文生视频并全面开源，为当前最大视频开源模型

美团Q3新业务首度实现除「优选」外整体盈利，管理层：海外业务目前仍聚焦沙特

精准学联合首都师范大学打造首个「超拟人一对一老师」，应用重点从解题回归到「人」

商汤绝影年底累计交付将破350万辆，王晓刚：智驾高端局竞争不止车端模型，端到端的决战场在云端

知乎Q3净亏损同比下降97%，周源：持续压缩低质内容，推动职业培训业务收支平衡

华住Q3酒店营业额同比增长11%，国内总计在营酒店数量上升至10707家

尚美数智携三大核心品牌宣布正式出海，马英尧：10年布局1000家店，进驻30国

乐信Q3净利环比增长33%：资金成本再创历史新低，环比下降98个BP

亿咖通科技出席沙特国家峰会，分享车载AI大模型落地实践

宁德时代首个商用品牌「天行」发布系列电池，开启纯电重型商用车全场景时代

拼多多Q3交易服务收入同比增长72%，赵佳臻：团队老化可能会对未来财务有一定影响

贝壳Q3非房产服务收入占比提升至38.3%：「贝好家」定位数据驱动型住宅开发服务平台

爱奇艺Q3总收入72亿元，龚宇：已将微短剧纳入内容组合，将很快实现对会员免费

快手Q3净利润同比增长24%，程一笑：短剧营销预算大幅增长，可灵AI商业化单月流水超千万

唯品会Q3净营收207亿元：SVIP活跃用户数同比增11%，回购2.75亿美元股票

宁德时代首次实现动力锂电池铁路运输，构建高效率、低成本动力运输体系

携程Q3净营收159亿元，梁建章：越来越多年轻人将旅行作为支出优先事项

量化投资人Arnott再谈美股小盘股价值股风格切换：通胀预期使市场看向高安全板块

京东Q3净利润同比增长48%，许冉：补贴政策效果尚未完全释放，继续保持价格竞争力

吉利控股旗下公司股权整合：极氪控股领克，吉利汽车持股极氪增至62.8%

B站Q3首次实现单季盈利，陈睿；游戏业务坚持长线运营，持续推进品类年轻化

喜马拉雅资本Q3减持苹果，建仓海洋油气公司Sable Offshore

有道Q3智能硬件净收入同比增长25%，周枫：战略聚焦和渠道重组取得积极成果

钉钉上半财年ARR远超2亿美元，双11期间平台应用累计交易额破亿元

挪瓦咖啡高校店覆盖超50城，预计2025年总体联营店面达1万家

腾讯Q3海外带动游戏板块增长近13%，小程序交易额超2万亿、To B产品毛利显著改善

TIMS天好中国Q3财报：季度净新增门店39家，加盟店增长明显

京东11.11采销直播订单量同比增3.8倍，多个AI硬件品类成交额均超100%

李佳琦直播间双11近1700家品牌参与、国货占六成：四大消费趋势涌现

瑞科生物拟向扬子江药业发行1.43亿股内资股，募资8亿元

进博期间上海酒店整体入住率达93%，对住宿业拉动明显

欧莱雅启动美妆行业首个面向IT专业大学生黑客松｜直击进博会

欧莱雅进博会揭幕三大展台，董事长安巩：坚信投资中国就是投资未来｜直击进博会

「英格卡集团零售发展中心」正式发布，为宜家中国长期发展注入动力｜直击进博会

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉