视频大模型，上新

财富 2024-11-10 14:12 上海

让“默片Sora”进入“有声电影时代”，二级市场热度颇高的智谱再出新动作。11月8日，智谱宣布，基于CogVideoX模型的最新技术进展和最新推出的音效模型CogSound，视频生成产品“清影”迎来全面提升，主要变化包括视频时长延长、画面提升、自带音效以及更好模拟人体动作和物理世界。

根据智谱提供的Demo，新清影在5个方面实现了提升。在模型能力上，新清影在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。通过更强的人物面部表演细节、动作连贯性和物理特性模拟，新清影提高了视频的自然度和逼真度。

图为智谱提供，由新清影生成的视频截图

在画面上，新清影支持生成10s、4K、60帧超高清视频，视觉体验更佳，动态画面更加流畅。此外，新清影支持任意比例的图像生成视频，并且具备多通道生成能力，同一指令或图片可以一次性生成4个视频。

图为智谱提供，由新清影生成的视频截图

值得一提的是，新清影可以生成与画面匹配的音效，音效功能将在本月上线公测。智谱团队认为，真正的智能一定是多模态的，听觉、视觉、触觉等共同参与了人脑认知能力的形成。因此，智谱打造了音效模型CogSound和音乐模型CogMusic。

在智谱展示的Demo中，针对巨轮撞向冰山、水下探险、动物进食等场景，CogSound能生成对应的复杂音效。CogSound基于GLM-4V的视频理解能力，能够准确识别并理解视频背后的语义和情感，在此基础上生成与之相匹配的音频内容，如爆炸、水流、乐器、动物叫声、交通工具声等。

“我们的理想状态是，只需一个好的创意，剩下的事AI都能辅助搞定，轻松将一个idea、一张图，变成一段自带bgm的影片。”智谱称。

在业内看来，音效模型的出现，能够实现视频与声音的同步创作。该模型在电影行业也具有广泛的应用前景，比如可以生成电影中的大规模战斗场景和灾难场景的声音，大大缩短了制作周期，降低了制作成本。

从长远来看，从脚本、视频画面到声音和音效，理想情况下传统视频制作步骤均可由大模型完成，从而实现全流程自动化。

智谱是最早布局多模态大模型技术的公司，从2021年开始，其在多模态文生图、文生视频领域先后研发了CogView（NeurIPS’21）、CogView2（NeurIPS’22）、CogVideo（ICLR’23）、RelayDiffusion（ICLR’24）等。

目前，智谱已经构建了独家、完善、原创的多模态模型矩阵。这包括语言模型、图像生成和理解模型、视频生成和理解模型和10月底刚刚发布的端到端情感语音模型GLM-4-Voice。随着音效模型CogSound的加入，多模态大模型家族在声音模态方面实现了人声、音效的多链路布局，健全了智谱基于图像、视频和声音的多模态模型矩阵。

二级市场方面，智谱概念因自主智能体AutoGLM成为近期市场热点，多家上市公司披露了与之的合作进展。11月7日，首都在线表示，公司和智谱是生态合作伙伴，双方明确将在智能算力集群、大模型商业化、一体机研发、国产GPU适配及地方智算中心建设等多个关键领域展开深度合作。公司已经获得了智谱“多元算力的适配权益”，后续公司将积极推动国产芯片和智谱大模型的适配，助力国产信创替代进程。此外公司将通过和智谱共同搭建生态的方式，促进智谱大模型在各行各业的应用落地。

11月4日，金现代表示，公司与智谱的合作主要体现在推进AI大模型落地应用方面。公司通过使用智谱ChatGLM4大模型以及依托自主研发的NLP、OCR、知识图谱等技术成果，积极推进AI技术在电力业务场景中的应用。

11月4日，彩讯股份表示，智谱是公司的战略合作伙伴，双方在大模型的行业落地以及AI应用层面均有合作。彩讯RichAICloud算力平台使智谱GLM-4等开源大模型推理速度提升，大幅降低了模型的部署成本，加速了产品的落地。

作者：孙小程

http://mp.weixin.qq.com/s?__biz=MjM5MDIwNDEyMg==&mid=2651138284&idx=2&sn=12af9e4bd413d0cfed8d6a0509fd7b55

上海证券报

上海证券报，新华社主办，中国证监会法定披露证券市场信息媒体。1991年创办，是新中国第一份提供权威金融证券专业资讯的全国性财经日报。追求政治品德、新闻品格、专业品位、服务品质、一流品牌，做有“品”的全媒体财经资讯服务机构。

最新文章

注意！不操作，最高亏40%

36.2亿元！聚焦这一领域

A股新利好！再创纪录

固态电池＋低空经济，最新研判

谈中国，黄仁勋最新

1.2万余家！北京发力

打卡！文化盛宴来了

重大资产置换！方案出炉

9时27分，首趟列车开出......

停牌！芯片股，大并购

上证夜读｜王传福：三十而立，是什么成就了比亚迪？

鸿蒙，新目标！

恒丰纸业拟收购锦丰纸业100%股权，进一步深化产业布局

AI辅诊，首次被列入！国家医保局详解→

俄方宣布：歼灭乌军最强部队

新风口！对冲基金大举买入

证监会出重拳！罚没3.35亿元，两牛散栽了

凌晨，旺旺紧急回应

昨夜，比特币、黄金向上“猛攻”！

朝鲜军队提升至战备状态

海外市场突变！欧盟、日本，谋划大动作

太保服务·纪录片丨夕阳正暖老有长护

东方证券官宣“换帅”

刚刚公告，任莉复职

华夏银行推出全新个人消费贷款产品“龙e贷”

自动泊车撞墙！小米回应

李强主持召开国务院常务会议

吴清会见黄天祐、梁凤仪

重要信号！北上广深，全部取消

海南出招：推动住房政策向多子女家庭倾斜

刚刚通报：快手被罚！

又一公募基金“换帅”

小雪至，冰雪“热”

中方决定，9国免签！

低空经济，上海放大招

稳外贸新举措！多部门发声

逆势上涨！又是AI

积极布局成长交银启合今日结募

中方回应所谓60%关税：由进口国消费者和最终用户“买单”

最低费率：0

昨夜，美联储“放鸽”

金正恩：核战争一触即发

上海国资出手！多家上市公司也在布局

上证早知道｜中国超德日，470台/万名员工；国产算力，大消息

华为注册！仙界、天界……来了

濒临退市，惊现神奇交易！46万元“买下”8400万元市值股份

加密货币，全面爆发！比特币新高

罕见！异常波动公告无效

国泰君安、海通证券，合并重组细节敲定！

中国平安联合主办“乌镇峰会”金融科技论坛，助力数智时代金融科技建设

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉