太赞了！豆包大模型发布 3 个全新模型，视频、音乐、同声翻译不在话下

文摘 2024-09-24 22:10 福建

关注 “AI 工具派”

探索最新 AI 工具，发现 AI 带来的无限可能性！

近期推荐

PPT：Tome｜美图PPT｜AiPPT｜Gamma
学习：Elmo｜Grammarly｜灵动翻译｜DeepL
编程：Codeium｜通义灵码｜SafurAI｜Comate
其他：TinyWow | PixVerse | Toolkit | SeekAI | 腾讯帮小忙
👉 2023 AI 工具汇总｜👉 在线知识库
👉 9 款 AI PPT 生成工具✨
👉 11 款热门 AI 视频生成工具✨

今天 Chris 忙了一下午，没来得及看火山引擎的发布会，因此一下班回家就赶紧搜索相关内容，整理本文和大家分享～还请点个免费的“赞”和“在看”支持一下哈。

正文如下：

今天豆包大模型家族又迎来 3 位新成员，包括视频生成模型、音乐模型和同声传译模型等，真的热闹起来了！

目前豆包大模型家族已经包括 12 位成员了，包括：豆包通用模型 pro、豆包通用模型 lite、视频生成模型、文生图模型、图生图模型、同声传译模型、语言识别模型、语音合成模型等等。

并且，豆包模型技术已经应用到了剪映、即梦AI和醒图工具中。

详细介绍：https://www.volcengine.com/product/doubao

接下来一起了解下今天新来的 3 为豆包新成员：

一、视频生成模型

今天发布的视频生成模型包括：

PixelDance 模型；
Seaweed 模型；

接下来详细介绍下：

1.PixelDance 模型

PixelDance 模型支持文生视频和图生视频，可生成长达 10 秒视频片段且语义理解能力出色。它能完成时序性多拍动作、支持多主体复杂交互，运镜效果丰富、兼容性强，可应用于影视创作、广告传媒等多个场景。

核心功能如下：

精准的语义理解：语义理解精准，支持复杂提示词，时序性多拍动作指令与多主体交互能力。
强大动态与炫酷运镜并存：动作灵动、镜头多样、表情丰富、细节丰满，支持超多镜头语言。
一致性多镜头生成：一键生成故事性多镜头短片能力，一个提示词实现多个镜头切换并保持主体、风格、氛围一致。
多风格、多比例兼容：提升视频生成泛化能力，支持包括黑白、2/3D 动画、国画、水彩等多种风格，包含 1:1、3:4、4:、16:9、9:16、21:9 六个比例。

2.Seaweed 模型

Seaweed 模型支持文生视频和图生视频两种方式，基于 Transformer 结构在潜空间训练，原生支持多分辨率生成，默认输出特定参数且可动态延长时长，能够生成具备丰富的细节层次的影视即视频，可应用于电商营销、动画教育等广泛的应用场景。

亮点功能如下：

逼真度极高：能够生成影视级的视频，具备丰富的细节层次。
视觉美感高：专业级色彩调和和光影布局，大幅提升画面视觉审美。
动态流畅：运动画面流畅自然，速度快慢符合物理运动机制。

3.体验模型

这两个模型目前可以在火山引擎中申请并体验。

模型体验：https://console.volcengine.com/ark/region:ark+cn-beijing/experience/vision

二、音乐模型

音乐生成模型可以依据文本描述或图片，轻松创作出一首时长 1 分钟且包含旋律、歌词和演唱的高品质音乐作品。该模型还支持 10 余种不同风格和情绪可供随心选择，极大地降低了音乐创作门槛，非常简单好用。

核心亮点如下：

高品质音乐生成：生成的歌词更准确、旋律更多样、演唱更真实；
创作门槛低：支持图片、灵感和写词生成音乐，简单方便；
应用场景多：比如音乐创作、音乐教育、娱乐产业、广告营销等；

三、同声传译模型

同声传译模型依托豆包大模型的语音理解能力，实现高质量、低延迟的端到端同声翻译，支持跨语言同音色翻译，以及粤、沪等常见方言的识别，适用于会议翻译、线上直播等实时场景。

体验地址：https://console.volcengine.com/ark/region:ark+cn-beijing/experience/voice?type=SI

核心功能如下：

实时翻译，超低延迟：具备超低延迟的端到端翻译，实现低时延与高质量的平衡。
自然高质量，超精准翻译：提供高质量精准翻译，语句流畅自然，接近人类专业口译员水平。
音色克隆，更多使用场景：支持基于音色克隆的语音翻译和字幕翻译，覆盖更多场景。
丰富的应用场景：提供超低延时且自然高质量的实时翻译，支持跨语言同音色翻译，可应用于会议论坛、线上直播等场景。

总结

今天豆包这 3 位新成员非常给力，虽然目前 Chris 还没能及时体验上，但是还是非常期待～国产牛逼。

以后可以使用豆包、智谱、通义等国产大模型家族，开发各种产品应用了。

补充一句～

Chris 新建了一个免费的知识星球，方便汇总平常分享的各类 AI 资讯内容，大家有兴趣可以加入了解～

创作不易，还请点赞支持

还想了解什么工具，欢迎评论

http://mp.weixin.qq.com/s?__biz=MzA5MjU0NzQ3Ng==&mid=2651425380&idx=1&sn=dccce504ea98a995f7a80c834bce22af

AI工具派

探索最新AI工具，发现AI带来的无限可能性！

最新文章

可灵 AI 免费额度调整！每个月都可以免费体验部分会员功能

Vidu AI：国产优秀 AI 视频生成工具，简单易用，支持多主体一致性，最高 1080P

吹爆这个AI神器！手慢无！

堆友：阿里巴巴推出的设计师服务平台，支持AI绘画、AI工具箱、3D素材等

必备神器！这款 AI 网页翻译插件超好用

就在刚刚，马斯克 xAI 正式公测 xAI API，每天赠送 25 美元免费积分！

使用 PixVerseAI 一键将图片生成酷炫毒液动画！

Freeflo：免费的AI绘画提示词灵感库，适用于Midjourney、SD等多个平台

刚刚！ChatGPT 搜索功能正式上线，免费可用

AI 月刊・10 月必看 36 条 AI 资讯，不能错过！

清言浏览器插件：智谱 AI 新产品，完全免费，支持 AI Agent、量子速读、写作助手等

AutoGLM：智谱AI的王炸功能，让手机成为你的贾维斯！

就在刚刚，Midjourney 上线全新图片编辑器和 AI 审核系统

豆包 AI 新功能：图片一键擦除、局部重绘、拓展图片、一键翻译文档、全新写作技能

自用分享：一款更聪明的 AI 阅读神器，谁用谁夸！

飞连：火山引擎推出的首个行业大模型IT赋能平台，IT+安全+豆包大模型，助力企业办公智能化

DeepTranslate：免费 AI 翻译插件，免费使用 Google/ChatGPT4o/微软翻译服务

“酷酷的海南”MV-AIGC创意大赛

Batch Tool：免费在线 AI 图片处理神器，批量去水印/去背景/WebGPU加速/免费无限次数

PDF2Audio：超强开源 AI 工具，打开了阅读 PDF 的新方式！

Bolt：非常棒的 AI 全栈 Web 开发工具，5 分钟从零到上线新网站

MOKI：美图推出的 AI 短片创作工具，全面开放、4K 分辨率、图生视频、AI 配音

太赞了！豆包大模型发布 3 个全新模型，视频、音乐、同声翻译不在话下

AI 小报第 4 期：Qwen2.5 全系列开源、可灵 1.5 模型、ChatGPT 新增指令等

阿里通义上线“智能生成PPT”，完全免费，一键下载

AI 小报第 3 期：OpenAI o1 系列模型、语雀 AI 上线、Felo AI 搜索、CueMe 写作神器等

CueMe：夸克最新 AI 写作神器，轻松生成上千种体裁长文

AI 神器太牛逼了！

Felo：免费 AI 智能搜索引擎，支持全网搜索、GPT-4o 搜索、多语言

支小宝：支付宝送给小年轻们的 AI 生活管家

GPT4.0 + AI 终身激活！不限量使用！我上车了！！

超强 AI 背景移除：在线批量处理，支持 WebGPU 加速，无需登录，可无限次免费使用！

AI 小报｜智谱 AI 大更新、夸克 AI、可灵 API、海螺 AI 生成音乐和视频

智谱 AI 免费赠送 1000 万 Tokens，大家别错过啦！附带使用教程

就在刚刚，Claude 面向所有用户开放 Artifacts 功能

智谱 AI 宣布 GLM-4-Flash 模型全面免费，太良心了！赶紧白嫖起来～

WPS 灵犀：WPS 推出的 AI 智能助手，支持搜全网、读文档、写作、PPT生成等

猴急！送《黑神话：悟空》啦

百度文库智能PPT：80%市场份额的 AI 生产力工具，一站式创作服务

FluxImg：一键使用 Flux.1 Pro 生成图片，完全免费

微信藏了个 AI 任意门！一键使用秘塔AI、智谱清言、腾讯元宝、讯飞星火等 40+ AI 应用

360 AI 助手：一站式体验国内领先大模型，包括豆包、Kimi、通义、智谱 AI 等

豆包 AI 上线新功能：截图识文字，一键 OCR、答疑解惑、翻译等

Chris 对“AI 工具派”的一些思考：知识星球和 AI PPT 社群

Aide：强大的 AI 编程插件，一键注释、转换、UI 图生成代码、AI 批量处理文件！

OpenAI 最新发布：在API中引入结构化输出、OpenAI 开发者大会

灵办AI：多功能学习办公 AI 助手，支持翻译、对话、写作、AI搜索、文案改写等

豆包 AI 新功能，一键收藏任何网页和内容，简直是收藏党的神器！

KimiChat 上线新功能，一键生成 PPT 太香了！

11 个 AI 领域的优质飞书知识库，完全免费，赶紧收藏起来！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉