首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

英伟达发布音频模型Fugatto，可以学狗叫！

旅行 2024-11-27 08:00 北京

NVIDIA放大招，音频AI要变天了！

音频AI的想象空间被NVIDIA彻底炸开了！

刚刚，NVIDIA推出了一款名为Fugatto的音频生成大模型，让「输入一句文字，生成任何声音」从科幻变成了现实。

超能力：一键生成魔幻音效

想听会「说话的猫」？想要「尖叫的萨克斯」？

Fugatto都能帮你搞定！

这款2.5B参数的音频模型简直是声音界的变形金刚：

混合音效：比如让小号和狗叫声完美融合
声音变脸：随意调整声音的语气、情绪、口音
声音精细过渡：想听暴雨慢慢转变成黎明鸟鸣？轻而易举

技术内核：32块H100打造

Fugatto的强大来源于其独特架构：

训练数据：数百万音频样本
计算力：32块NVIDIA H100 GPU联合作战
创新技术：ComposableART，能将原本分离的音频指令完美融合

现实应用：创意无限

这款模型将彻底改变多个领域：

音乐创作：快速原型和风格实验
游戏开发：动态音效生成
语言学习：声音特征灵活变换

光是这些能力，就足以让音频创作者们兴奋得睡不着觉！

准备好听"不可能的声音"了吗？

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453458118&idx=1&sn=42a972279e7bb5aa11da09f8e3436179

关注AGI 的沿途风景！

最新文章

Qwen重磅发布QwQ推理模型，超越OpenAI o1

xAI要开游戏工作室了！马斯克：让游戏再次伟大！

OpenAI首席商务官：2025年将迈向第4、5级AGI！

苹果M4芯片硬刚RTX 3090！

刚刚，软银给OpenAI加注15亿美元，并允许员工套现！

小心！LLM 正偷偷黑进你的电脑！

英伟达发布音频模型Fugatto，可以学狗叫！

揭秘英伟达 A10 与 A10G 性能差异！

重磅！Reka AI 研究科学家Yi Tay正式宣布重返Google DeepMind！

JSON 才是大模型输出的噩梦？！

重磅！OpenAI 因盗用13万部影视训练模型而被诉！

OpenAI 即将带来的圣诞礼物：full o1、Sora还是Orion？

刚刚，苹果携手谷歌遭英国反垄断调查！

凉凉？！苹果计划于2026年启动大模型版Siri

Uber计划收购中国自动驾驶公司股份！

岌岌可危的摩尔定律，正被ASML 的EUV 光刻机续命！

Anthropic重磅发布MCP协议，或许这才是AGI的真正形态！

15分钟！用Windsurf完成markdown转换工具开发

4种提示词格式大PK：JSON最佳，且比Markdown准确率高两倍！

Cursor is AGI！

重磅！OpenAI推理AI霸主地位不保，新玩家纷纷入场

重磅！英伟达发布 H200 NVL！

年轻人们已陷入「AI 哀伤七阶段」

马斯克：人类文明只是宇宙的一瞬，我们必须成为多星球物种！

OpenAI 翻车，Whisper也会产生幻觉！

前谷歌CEO埃里克·施密特：脱缰的AI已近，但普通人尚未做好准备！

FridonAI：用AI驱动的加密货币分析工具！

Cursor 推出 v0.43，自动编程代理来了！

Gradio推出一键添加Logo魔法，开启品牌无限可能！

Grok 全新「专注模式」出炉，背后还隐藏着这些秘密！

FastBinaryEncoding——序列化格式王者来袭：秒杀JSON和Protobuf，性能提升10倍！

星际穿越TARS 开源！你也能拥有一个AI机器人了！

小心，你正在被AI 进行职场监控！

再也不能相信ChatGPT 写的代码了！

你知道吗？Qwen2VL可以一键重标注百万图片数据集

英伟达或成首个10万亿公司！

AI的下一个进化时代——后训练都有哪些开源项目？

ChatGPT 将推出屏幕分享功能！

GPT-4o 代码能力暴跌，开发者集体转投 Claude！

警惕AI投毒！ChatGPT 写的代码导致私钥被盗，损失数万元！

重磅！谷歌Gemini 2.0 将于12月第二周发布！

刚刚，苹果发布AIMv2，再次搅动视觉AI江湖！

DeepLearning.AI放大招：5大AI学习路线图，你的专属进阶之路！

人工智能正在取代人类的就业市场！

刚刚，美国司法部要求谷歌出售Chrome！

开源GraphRAG平台autoflow：打造更智能的AI问答系统

重磅！全球首个去中心化10B模型训练完成，一周内开源！

亚马逊再砸40亿美元，Anthropic要用AWS芯片训练下一代AI

阿里推理模型来了！Marco-o1 发布即开源

重磅！OpenAI 要自己造浏览器了！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉