AI日报：Suno发布V4音乐生成模型；谷歌最新AI视频制作神器Vids；

科技科技 2024-11-11 15:59 福建

‍关注我，记得标星⭐️不迷路

AI日报

11月11日•AIbase

1、豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真！

2、谷歌推出AI视频制作神器Vids：输入文字秒变视频，小白也能轻松创作！

3、Suno发布V4音乐生成模型音频演示视频，音质和风格大提升

4、百度文心一言AI绘画功能升级

5、昆仑万维SkyReels AI短剧平台将于12月10日在美国正式上线

6、CogSound让视频“声”动起来，从此告别无声尴尬！

7、即梦AI宣布Seaweed视频生成模型开放使用

8、URAvatar：用手机扫描即可生成个性化虚拟头像

9、告别建模苦恼！DimensionX单图生成3D/4D场景

10、Meta AI发布FBDetect：实时识别0.005%性能下降，节省数千台服务器

1. 豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真！

SeedEdit是豆包大模型团队推出的图像编辑工具，通过一句话命令AI实现精准修改图片元素，比MJ更简单快捷。用户只需输入指令，如"把项圈变成珍珠项链"，即可轻松编辑图片。SeedEdit在维持原始图像和生成新图像之间取得平衡，支持多轮编辑，精准理解用户指令，保持高质量。

亮点提要：

🎨 一句话P图成真：SeedEdit通过一句话命令AI实现精准修改图片元素，更简单快捷。

🚀 最佳平衡设计：SeedEdit在维持原始图像和生成新图像之间取得平衡，保持高质量。

👀 多轮编辑支持：SeedEdit支持用户多次修改图像，让用户得到满意的效果。

详情入口：

🔗 https://huggingface.co/spaces/ByteDance/SeedEdit-APP

2. 谷歌推出AI视频制作神器Vids：输入文字秒变视频，小白也能轻松创作！

谷歌最近推出了名为Vids的AI视频演示应用程序，利用Gemini AI模型驱动，用户可以通过简单的文字提示或上传Google Drive文档生成视频演示文稿。Vids具有强大的AI智能创作能力，简化了视频制作过程，提供丰富模板和自定义编辑功能。同时支持便捷的语音和录音功能，实时协作和安全共享，适用于多种场景。Vids的推出标志着AI技术在视频制作领域的重大突破，让用户轻松创作高质量视频内容。

亮点提要：

✨ 强大的AI智能创作能力，自动生成视频草稿包含场景、脚本、推荐媒体素材和背景音乐，简化视频制作过程。

🎬 提供丰富模板和自定义编辑功能，用户可选择合适模板，添加动画、转场、照片特效，满足个性化编辑需求。

🔊 支持便捷的语音和录音功能，包括AI语音旁白、滚动式提词器，方便用户录制、添加讲解和展示内容。

详情入口：

🔗 https://workspace.google.com/products/vids/

3. Suno发布V4音乐生成模型音频演示视频，音质和风格大提升

Suno 公司最新发布的v4音乐生成模型展现出显著的音质和多样性提升，通过深度学习技术生成更自然和富有表现力的音乐作品。这一创新不仅适用于个人创作，还可以推动AI音乐生成技术的普及和应用。

亮点提要：

🎵 v4音乐生成模型展现出显著的音质和多样性提升

🎶 通过深度学习技术生成更自然和富有表现力的音乐作品

🎤 适用于个人创作和商业音乐制作，推动AI音乐生成技术的普及

4. 百度文心一言AI绘画功能升级

百度AI旗下的文心一言AI绘画技术迎来了重大升级，现在支持一键生成多比例图片，极大地简化了新媒体配图流程。技术进步使得文心一言AI在语义理解、视觉效果和细节刻画上都有显著提升，提高工作效率，提升视觉效果，使新媒体配图变得简单易行。

亮点提要：

🖌️ 一键生成多比例图片：用户输入所需的图片比例，系统自动生成多尺寸图片，覆盖各种需求，提高工作效率。

🎨 支持任意风格绘制：智慧生图能绘制多种风格，用户输入描述即可生成高质感、细节丰富的图片，提升视觉效果。

🖼️ 参考图生成图片：支持参考图生成，使人物生成更美观，画面更精准，满足不同内容创作需求。

5. 昆仑万维SkyReels AI短剧平台将于12月10日在美国正式上线

昆仑万维科技股份有限公司旗下的AI短剧平台SkyReels即将在美国正式上线，这标志着公司在全球AI娱乐市场的扩张，为北美观众带来全新的智能短剧体验。平台通过创新技术和功能，为内容创作者提供强大的创作工具，同时降低了AI短剧创作门槛，使非专业用户也能轻松上手。

亮点提要：

🚀 昆仑万维SkyReels AI短剧平台12月10日在美国正式上线，标志着全球AI娱乐市场扩张。

💡 SkyReels集成视频大模型与3D大模型，颠覆视频内容创作流程，实现创作者创作梦想。

🔑 SkyReels新增3D交互编辑、AI全身动捕等特色功能，与北美内容创作者合作丰富内容，提升用户体验。

6. 视频也能脑补配音？CogSound让视频“声”动起来，从此告别无声尴尬！

CogSound是一款基于人工智能技术的音效生成模型，能为无声视频添加逼真的音频体验，让观众享受身临其境的音效体验。它像经验丰富的配音大师，识别视频场景，匹配合适音效，并确保音视频同步。采用先进技术确保音效与画面完美同步，避免“音画不同步”的尴尬。

亮点提要：

🔊 CogSound是基于人工智能技术的音效生成模型，能为无声视频添加逼真音频体验。

🎬 CogSound识别视频场景，匹配合适音效，并确保音视频高度同步。

🔧 CogSound采用先进技术保证音效与画面完美同步，避免“音画不同步”的尴尬。

7. 即梦AI宣布Seaweed视频生成模型开放使用

即梦AI宣布开放Seaweed视频生成模型，提供专业级光影布局和色彩调和，画面视觉美感和真实感。模型基于DiT架构，能实现流畅自然的大幅度运动画面。Pro版模型可实现多拍动作与多主体复杂交互，攻克多镜头切换难题，适配各种设备比例，助力专业创作者和艺术家们的创作。

亮点提要：

⚙️ Seaweed视频生成模型开放使用，提供专业级光影布局和色彩调和。

🎥 模型基于DiT架构，能实现流畅自然的大幅度运动画面，仅需60s生成高质量AI视频。

🎬 Pro版模型可实现多拍动作与多主体复杂交互，攻克多镜头切换难题，适配各种设备比例，助力专业创作者和艺术家们的创作。

8. URAvatar：用手机扫描即可生成个性化虚拟头像

URAvatar技术利用手机扫描生成高保真的虚拟头像，提升了虚拟头像的视觉效果，让用户可以实时驱动和调整头像。该技术采用可学习的辐射传输模型，实现了实时渲染和光照迁移，为虚拟头像带来新的可能性。用户还可以独立控制头像的凝视方向和颈部动作，增强了虚拟交互体验。

亮点提要：

🌟 URAvatar技术通过手机扫描生成高保真的虚拟头像，提升了虚拟头像的视觉效果。

💡 采用可学习的辐射传输模型，实现了实时渲染和光照迁移，为虚拟头像带来新的可能性。

🎮 用户可独立控制头像的凝视方向和颈部动作，增强了虚拟交互体验。

9. 告别建模苦恼！DimensionX单图生成3D/4D场景

我看到了一篇关于香港科技大学和清华大学研究团队推出的全新AI框架DimensionX的文章。这个框架可以仅凭一张图片生成充满细节的3D和4D场景，为游戏开发、虚拟现实和影视制作领域带来了革命性突破。它的核心魔法是可控视频扩散技术，让我感到非常惊叹和兴奋。

亮点提要：

🔮 DimensionX是一款AI框架，能从单张图片中提取空间和时间信息，生成连续的视频帧，最终组合成完整的3D或4D场景。

🎥 DimensionX配备了S-Director和T-Director两个强大的“魔法棒”，分别控制空间维度和时间维度，让用户可以自由操控视角和物体运动。

🌟 DimensionX还引入了轨迹感知机制和身份保持去噪策略，优化真实场景生成，确保3D和4D场景更加真实可信。

详情入口：

🔗 https://chenshuo20.github.io/DimensionX/

10. Meta AI发布FBDetect：实时识别0.005%性能下降，节省数千台服务器！

在大型云基础设施管理中，即使微小性能下降也可能导致显著资源浪费。Meta AI推出FBDetect，能实时识别0.005%性能回归，帮助Meta避免约4000台服务器资源浪费，提高基础设施效率。

亮点提要：

🔍 FBDetect能监测到微小的性能回归，甚至低至0.005%，极大提高了检测精度。

💻 系统覆盖约80万个时间序列，涉及多个性能指标，并能在大规模环境中进行精准分析。

🚀 FBDetect经过七年实际应用，每年帮助Meta避免约4000台服务器资源浪费，提高了基础设施整体效率。

详情入口：

🔗 https://tangchq74.github.io/FBDetect-SOSP24.pdf

11. Anthropic发布新型token计数API，支持多种Claude模型

在当前的人工智能领域，Anthropic公司推出了新型token计数API，旨在帮助开发者更好地管理语言模型中的token使用，提升交互效率和控制能力。该API准确估算token数，优化token使用，降低成本，适用于构建客户支持聊天机器人、文档摘要和互动学习工具。

亮点提要：

🌟 提升开发效率：新型token计数API帮助开发者准确掌握令牌使用情况，优化开发过程。

💰 控制成本效益：理解token使用，有效控制API调用费用，适合成本敏感项目。

🤖 多模型支持：支持多种Claude模型，灵活应用于不同场景，提升开发者体验。

详情入口：

🔗 https://docs.anthropic.com/en/docs/build-with-claude/token-counting

12. 10月份ChatGPT流量激增至37亿，谷歌NotebookLM凭新功能飙升成黑马！

ChatGPT和谷歌NotebookLM在2024年10月表现抢眼，前者全球访问量达到37亿次，同比增长115.9%，后者因新功能推出访问量激增至3150万次。AI服务整体增长态势良好，未来有望加速增长。

亮点提要：

📈 ChatGPT全球访问量达到37亿次，同比增长115.9%。

🎙️ 谷歌NotebookLM因新推出的AI播客功能访问量激增至3150万次。

💻 其他AI服务如微软的Co-pilot和谷歌的Gemini也实现了一定的增长。

13. AI编码助手Cursor背后公司估值暴涨至25亿美元，投资者竞相抢购

Anysphere旗下的AI编码助手Cursor月收入迅速增长至每月400万美元，吸引了大量风险投资者的关注。公司估值在短短几周内从15亿美元飙升至25亿美元，成为市场焦点。创始团队均为麻省理工学院学生，曾毕业于OpenAI的加速器项目，展现出强大的潜力和吸引力。

亮点提要：

🌟 Anysphere的AI编码助手Cursor月收入从400万美元迅速增长至每月400万美元。

💰 风险投资者对Anysphere的兴趣激增，公司估值从15亿美元升至25亿美元。

🎓 Anysphere成立于2022年，创始团队均为麻省理工学院学生，曾毕业于OpenAI的加速器项目。

14. 最后一曲！甲壳虫乐队借AI修复新曲《Now and Then》获两项格莱美提名

甲壳虫乐队利用人工智能技术修复新曲《Now and Then》，并获得两项格莱美提名，尽管已解散50年，仍引人惊讶。保罗・麦卡特尼亲自参与制作，通过AI技术修复约翰・列侬的录音，展现出乐队的音乐魅力。格莱美提名使乐队再次成为关注焦点。

亮点提要：

🎵 甲壳虫乐队的新曲《Now and Then》获得年度唱片和最佳摇滚表演两项格莱美提名。

🎤 此曲通过AI技术修复了约翰・列侬1978年的录音，保罗・麦卡特尼亲自参与制作。

📈 尽管播放量相对较低，甲壳虫乐队依然在与当代音乐巨星竞争中引发广泛关注。

关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台

这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程

更多AI硬核内容直接访问AiBase官网，一键开启你的AGI之旅！

官网：https://www.aibase.com/zh/tools/

↓点击阅读原文，进AIbase官网.

http://mp.weixin.qq.com/s?__biz=MzIzNjg3NTUzOA==&mid=2247495055&idx=2&sn=b4daed165dfc39af431a06ebd667aea3

AIbase基地

每日AI新闻聚合阅读，掌握AI前沿资讯、AI新品、政策动向，洞察AI行业趋势，深思未来。

AI日报：科大讯飞星火多模态交互大模型上线；腾讯AI智能工作台ima上线Windows版;阿里通义实验室推出代码模式

大升级！ChatGPT Windows桌面版全面上线，macOS版新增与应用协作功能

remove饭碗被砸？免费高清抠图软件RMBG 2.0强力升级复杂背景也能抠干净

AI日报：OpenAI将推首款自主AI代理Operator；腾讯元宝2.0版本上线；AI加持苹果Final Cut Pro11

剁手党狂喜！AI试衣技术Fashion-VDM颠覆传统网购衣服再也不怕踩雷了！

AI日报：阿里海外推AI搜索引擎Accio；Vidu-1.5版本即将上线；百度“自由画布”公测；OpenAI技术大佬Greg回归

AI日报：百度世界2024大会发布文心iRAG和无代码“秒哒”；阿里开源Qwen2.5-Coder全系列

超自然AI换头技术CHANGER，以后再也不怕演员塌房了！

豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真！

AI日报：Suno发布V4音乐生成模型；谷歌最新AI视频制作神器Vids；

还在用百度？让 ChatGPT 成为你的默认搜索引擎，AI 秒搜更智能！

Krea AI上线Lora训练功能我一顿操作猛如虎，结果......

AI日报：快手推“可灵AI”独立APP；百度将推AI智能眼镜；智谱AI开源CogVideoX v1.5并上线“新清影”

AI颠覆服装设计！FLUX.1-dev LoRA 服装生成器来了设计小白也能秒出服装效果图

AI日报：AI助手豆包开启视频生成内测；OpenAI买下Chat.com域名；阿里测试AI动漫创作工具 “Animode”

字节推出单图视频驱动模型 X-Portrait 2 超低成本高效的肖像动画技术

AI日报：InstantX推FLUX图像生成黑科技；面部迁移模型HelloMeme；游戏实时生成算法GameGen-X

黑神话悟空也能用AI生成了？GameGen-X 颠覆游戏开发，传统游戏瑟瑟发抖！

AI日报：腾讯推出Huanyuan-large开源模型；xAI面向开发者推出API；天工AI发布AI高级搜索功能

动画设计福音！Rive推Layouts功能画面自动适配各种屏幕，搞定排版难题！

Diffusion 模型也能“举一反三”？阿里IC-LoRA给图像生成模型增加情节记忆力能力

AI日报：Claude新增PDF文件处理功能；支持视频转视频的开源神器ComfyUI-MochiEdit

告别随机生成！Runway推出高级摄像机控制像导演一样掌控镜头

每天刷无数平台？Follow 一站搞定，只看好内容！

告别“假脸”模特！阿里EcomID重磅来袭原生支持ComfyUI 电商图片要变天？

带图层的AI生图软件来了！Blendbox Alpha 版发布支持实时调光影、改构图

AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT高级语音模式登陆Mac

用AI制作爆火Ins小浣熊自拍视频小红书从0粉到13万粉的暴力增长法则

AI日报：SD轻量级3.5 Medium模型免费开放商用；Hedra 推出全新语音克隆功能；微信灰度测试AI问答功能

小红书博主私藏的AI玩图神器“妙刷”被我找到了!竟然完全免费...

又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

AI日报：神秘AI模型Red_panda横空出世；xAI为Grok添加图像理解功能；更多特效的PixVerse V3发布

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

AI日报：AutoGLM智能体可自动帮点外卖；敏神重磅更新Flux版ic-light模型

工作慢如蜗牛？腾讯会思考的知识库 ima.copilot 一站搞定搜、读、写！

告别PS！Midjourney新增外部图像编辑器还可重绘光影和材质

AI日报：Claude上线数据分析功能；KREA AI推出视频延展功能；美图奇想大模型生图能力升级；苹果悬赏百万寻找AI漏洞

AI日报：科大讯飞星火4.0 Turbo大模型发布；全能型图像生成模型OmniGen问世；iOS18.2 正式接入ChatGPT

简单文本即可创建个性化语音！ElevenLabs 推出全新AI语音生成工具Voice Design

AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；Ideogram上线图片魔法填充功能

Claude3.5重磅升级：Sonnet编码能力秒杀o1，Haiku性价比无敌，还会自己玩电脑！

个人可免费商用！Stability AI发布Stable Diffusion3.5系列文生图模型

AI日报：Rhymes AI开源视频生成模型Allegro；Grok API正式上线；OPPO收购波形智能

ComfyUI发布桌面一键安装包ComfyUI V1 支持自动更新，自动安装Python依赖环境

AI日报：阿里开源文档模型DocOwl 1.5；Midjourney图像编辑器新功能下周上线；Viggle AI推对口型功能

马桶也能装"摄像头"？这家创企要用AI帮你看大便

AI日报：复旦、百度新模型可生成1小时长视频；全新ChatGPT Windows版本上线；NotebookLM又上2个新功能

复旦、百度联手打造全新AI模型Hallo2 可生成4K超高清+1小时超长视频！

AI日报：ChatGPT 月访问量突破 31 亿；英伟达推超快AI图像生成模型Sana；Mistral AI推超强边缘AI模型

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉