商汤重磅推出Vimi——亮相WAIC，成为“镇馆之宝” | 2024世界人工智能大会

文摘 2024-07-17 20:45 浙江

7月4日，2024世界人工智能大会在上海盛大开幕。商汤科技推出的首个面向C端用户的可控人物视频生成模型——Vimi，荣获 "镇馆之宝" 这一大会展览的最高荣誉。

何为 Vimi

可控人物视频生成算法模型 Vimi 是首个可控人物视频生成AIGC产品。基于商汤日日新大模型能力，它可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片，从而生成和目标动作一致的人物类视频。

除了可控性外，Vimi 在生成人物稳定性、生成视频时长上，也突破了其它大模型AI视频生成的限制，可以稳定的生成分钟级的单镜头人物视频。与常规图片表情控制类技术只能控制头部表情动作不同，Vimi 不但可以控制人物表情，还可以控制肢体动作，并生成合理的头发、服饰、背景，并支持光影变化，是首个稳定的可控人物视频生成产品。

内测申请地址：https://vme-int.softsugar.com/questionnaire/

产品优势

可控人物：可控生成高一致性的人物表情及肢体动作视频；
多种控制方式：可以通过人物视频、动画参数、语音文字等输入驱动；
分钟级单镜头：支持生成分钟级的单镜头人物视频；
生成合理的视频场景：支持人物合理的头发、服饰、背景补全，并支持光影变化。

应用场景：

据悉，该模型主要面向C端用户。根据现场展示来看，Vimi的表现相当惊艳！不仅能够实现精准的人物表情控制，同时还可实现在半身区域内控制照片中人物的自然肢体变化，并自动生成与人物相符的头发、服饰及背景变化，可稳定生成1分钟的单镜头人物类视频。

1.根据照片，可快速生成写真视频，这一点可以轻松搞定。

2.可快速生成个性动态的表情包

目前，Vimi已在商汤科技官网开放预约体验。在明天（7月5日）商汤科技举办的“大爱无疆·向新力”人工智能论坛上，还将揭开Vimi的更多细节，敬请期待。

❝
申请申请：
https://vme-int.softsugar.com/questionnaire/

技术交流

加入「AIGCmagic社区」群聊，一起交流讨论，涉及 AI视频、AI绘画、Sora技术拆解、数字人、多模态、大模型、传统深度学习、自动驾驶等多个不同方向，可私信或添加微信号：【m_aigc2022】，备注不同方向邀请入群！！

推荐阅读

1、加入AIGCmagic社区知识星球

AIGCmagic社区知识星球不同于市面上其他的AI知识星球，AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台，涉及AI绘画、AI视频、ChatGPT等大模型、AI多模态、数字人、全行业AIGC赋能等50+应用方向，内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AIGC模型、AIGC数据集和源码等。

那该如何加入星球呢？很简单，我们只需要扫下方的二维码即可。知识星球原价：299元/年，前200名限量活动价，终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠：

2、《三年面试五年模拟》面试秘籍

《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法，力求让读者在获得心仪offer的同时，增强技术基本面。

Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main，欢迎大家star！

想要一起进行项目共建的朋友，欢迎点击链接加入项目团队：《三年面试五年模拟》版本更新白皮书，迎接AIGC时代

3、Stable Diffusion XL核心基础知识，从0到1搭建使用Stable Diffusion XL进行AI绘画，从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型，AI绘画领域的未来发展等全维度解析文章正式发布

码字不易，欢迎大家多多点赞：

Stable Diffusion XL文章地址：https://zhuanlan.zhihu.com/p/643420260

4、Stable DiffusionV1-V2核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用Stable Diffusion进行AI绘画，从0到1上手使用Stable Diffusion训练自己的AI绘画模型，Stable Diffusion性能优化等全维度解析文章正式发布

码字不易，欢迎大家多多点赞：

Stable Diffusion文章地址：https://zhuanlan.zhihu.com/p/632809634

5、ControlNet核心基础知识，核心网络结构，从0到1使用ControlNet进行AI绘画，从0到1上手构建ControlNet高级应用等全维度解析文章正式发布

码字不易，欢迎大家多多点赞：

ControlNet文章地址：https://zhuanlan.zhihu.com/p/660924126

6、LoRA系列模型核心基础知识，从0到1使用LoRA模型进行AI绘画，从0到1上手训练自己的LoRA模型，LoRA变体模型介绍，优质LoRA推荐等全维度解析文章正式发布

码字不易，欢迎大家多多点赞：

LoRA文章地址：https://zhuanlan.zhihu.com/p/639229126

7、最全面的AIGC面经《手把手教你成为AIGC算法工程师，斩获AIGC算法offer！（2024年版）》文章正式发布

码字不易，欢迎大家多多点赞：

AIGC面经文章地址：https://zhuanlan.zhihu.com/p/651076114

8、10万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布

码字不易，欢迎大家多多点赞：

算法工程师三年面试五年模拟文章地址：https://zhuanlan.zhihu.com/p/545374303

《三年面试五年模拟》github项目地址（希望大家能给个star）：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer

9、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识，从0到1搭建AI绘画框架，从0到1使用AI绘画框架的保姆级教程，深入浅出介绍AI绘画框架的各模块功能，深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布

码字不易，欢迎大家多多点赞：

AI绘画框架文章地址：https://zhuanlan.zhihu.com/p/673439761

10、其他

Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本，大家可以关注公众号WeThinkIn，并在后台【精华干货】菜单或者回复关键词“YOLO” 进行取用。

http://mp.weixin.qq.com/s?__biz=Mzg4NDYwOTUwNA==&mid=2247487913&idx=2&sn=7b632937e23f2c575176571e6493772a

WeThinkIn

Rocky相信人工智能，数据科学，商业逻辑，金融工具，终身成长，以及顺应时代的潮流会赋予我们超能力。

AIGCmagic社区共建邀请函！

AIGC时代算法工程师的面试秘籍（第二十式2024.8.5-8.18） |【三年面试五年模拟】

AIGCmagic社区共建邀请函！

AIGC时代算法工程师的面试秘籍（第十九式2024.7.22-8.4） |【三年面试五年模拟】

开源实操 | DiffIR2VR-Zero：模糊视频8K高清修复技术

AIGCmagic社区共建邀请函！

半年耕耘，《AIGCmagic社区知识星球》重磅升级！限量活动中！

新手必看 | 44张图带您极简学习Transformer | 分步数学示例（建议收藏）

AIGCmagic社区共建邀请函！

AIGC时代算法工程师的面试秘籍（第十八式2024.7.8-7.21） |【三年面试五年模拟】

A100算力加持！书生大模型实战营全面升级，趣味闯关等你来

AIGCmagic社区共建邀请函！

通义千问Qwen系列登顶国际测评榜单，给我们带来的本质思考是什么 |【WeThinkIn出品】

商汤重磅推出Vimi——亮相WAIC，成为“镇馆之宝” | 2024世界人工智能大会

AIGCmagic社区共建邀请函！

AIGC时代算法工程师的面试秘籍（2024.6.24-7.7第十七式） |【三年面试五年模拟】

AIGC | 「视频生成」系列之Suno制作MV视频工作流分享（保姆级）

AIGCmagic社区共建邀请函！

WAIC 2024大会，给AI行业带来了哪些本质思考 |【WeThinkIn出品】

2万字长文｜YOLOv10的起源：YOLO系列的十年全面综述【YOLOv1-YOLOv10】(建议收藏)

AIGCmagic社区共建邀请函！

传统深度学习领域再放大招 | YOLOv10：毫秒级实时端到端目标检测开源模型

AIGCmagic社区共建邀请函！

AIGC时代算法工程师的面试秘籍（2024.6.10-6.23第十六式） |【三年面试五年模拟】

再次封神！AI 大模型渗透太快了。。。

AIGC时代算法工程师的面试秘籍（2024.5.27-6.9第十五式） |【三年面试五年模拟】

ChatGPT-4o也参加高考了，还写了六大考卷的全部作文！ |【WeThinkIn出品】

AIGC时代算法工程师的面试秘籍（2024.5.13-5.26第十四式） |【三年面试五年模拟】

待会删！推荐AI大模型实践教程（教程+资料+工具）

AIGC时代算法工程师的面试秘籍（2024.4.29-5.12第十三式） |【三年面试五年模拟】

《三年面试五年模拟》版本更新白皮书，迎接AIGC时代

招募通知：AIGCmagic社区共建伙伴招募中！

《AIGCmagic社区星球》，五大AIGC方向正式上线！让我们在AIGC时代携手同行！限量活动中！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉