AI日报：神秘AI模型Red_panda横空出世；xAI为Grok添加图像理解功能；更多特效的PixVerse V3发布

科技科技 2024-10-29 16:45 福建

关注我，记得标星⭐️不迷路

AI日报

10月29日•AIbase

1、生图能力超越Flux1.1 Pro！神秘AI模型红熊猫Red_panda横空出世

2、xAI为Grok添加图像理解功能

3、又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

4、谷歌Gmail网页版上线AI功能 “帮我写”，邮件撰写润色更轻松

5、视频理解领域杀出黑马！Video-XL这款模型能处理长达一小时的视频！

6、苹果iOS 18.2 确认于12月推送将为Siri植入ChatGPT

7、报道称，Meta 正在研发自家AI搜索引擎，减少对谷歌依赖

8、智源推出全能视觉生成模型 OmniGen 集多项能力于一体

9、突破性开源项目：手机也能运行的轻量级数字人来了

10、环球音乐与AI公司携手打造 “有道德” 的AI 音乐生成模型KLayMM

11、苹果推配备M4的新款iMac

12、周鸿祎：AI不该成为超级神明，而应是人类的茶叶蛋

13、预测：生成式AI将产生大量电子废物

1. 生图能力超越Flux1.1 Pro！神秘AI模型红熊猫Red_panda横空出世

一款名为red_panda的神秘AI图像生成模型在Artificial Analysis的基准测试中表现惊人，超越了行业领军企业的产品。其在文本转图像测试中以1244分的成绩领跑，展现出技术优势和高效率。红熊猫的真实感图像超越了传统AI作品，展现出色的文本提示理解和执行能力。红熊猫的横空出世推动了行业标准的提升，引发关注。

亮点提要：

🚀 红熊猫AI模型在基准测试中以1244分的成绩领跑，超越行业领军企业产品

💡 红熊猫生成的图像具有极高的真实感，超越了传统AI作品

🔗 红熊猫的横空出世推动了行业标准的提升，引发关注

详情入口：

🔗 https://artificialanalysis.ai/text-to-image/arena

2. xAI为Grok添加图像理解功能还能看懂梗图的幽默

马斯克旗下xAI公司最新为其AI模型Grok增添了图像理解功能，用户可上传图片向AI助手提问。马斯克展示了Grok的新能力，包括理解图片内容和幽默元素。功能仍在早期阶段，团队将持续改进。xAI通过与黑森林实验室合作，新增多模态理解功能，提升用户体验和开发者API。

亮点提要：

✨ 图像理解功能：Grok现可理解图片内容和幽默元素。

🚀 功能扩展：自推出Grok-2模型以来，xAI不断扩展功能，与FLUX.1模型合作实现图像生成。

🔥 用户体验提升：新增多模态理解功能，马斯克承诺很快实现文档处理需求。

3. 又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

PixVerse V3版本带来了全方位的功能升级，让创作者体验更专业、更有趣。从视频特效到风格功能再到视频延长，都有显著提升，为内容创作者提供更全面、更专业的视频创作平台。

亮点提要：

✨ 视频特效升级：新增万圣节主题特效，操作简单直观，丰富节日创作素材。

🎨 风格功能升级：支持动漫、3D动画、粘土和写实四种风格，可应用于不同场景。

🔥 视频延长功能：用户可额外增加5-8秒内容，精确控制新增片段内容走向，生成连贯动作画面。

详情入口：

🔗 https://app.pixverse.ai/home

4. 谷歌Gmail网页版上线AI功能 “帮我写”，邮件撰写润色更轻松

谷歌在网页版Gmail上推出了“帮我写”功能，利用Gemini AI帮助用户撰写和修改邮件，提升了邮件撰写的便利性和效率。这一功能仅限于订阅Google One AI Premium或拥有Gemini Workspace插件的用户使用，为用户提供了个性化的邮件撰写体验。新增的“润色”快捷方式让用户可以快速优化邮件内容，进一步提升邮件的质量。

亮点提要：

🌟 “帮我写”功能上线网页版Gmail，利用Gemini AI帮助用户撰写和修改邮件。

🔑 仅限订阅Google One AI Premium或拥有Gemini Workspace插件的用户使用。

⚡ 新增“润色”快捷方式，方便用户快速优化邮件内容。

详情入口：

🔗 https://www.chinaz.com/ainews/12801.shtml

5. 视频理解领域杀出黑马！Video-XL这款模型能处理长达一小时的视频！

Video-XL是一款专为高效的小时级视频理解而设计的超长视觉语言模型，利用“视觉上下文潜在摘要”技术将长视频内容压缩成精简形式，提高效率并保留关键信息。在多个长视频理解基准测试中表现出色，效率和效果平衡。应用前景广阔，可用于电影摘要、监控异常检测和广告植入识别。

亮点提要：

🚀 Video-XL是专为处理超长视频而设计的超长视觉语言模型，利用视觉上下文潜在摘要技术压缩视频内容。

💡 Video-XL在多个长视频理解基准测试中表现领先，尤其在VNBench测试中准确率高出近10%。

⚙️ Video-XL在效率和效果之间取得平衡，在单个80GB GPU上处理2048帧视频，同时保持近95%的准确率。

详情入口：

🔗 https://github.com/VectorSpaceLab/Video-XL

6. 苹果iOS 18.2 确认于12月推送将为Siri植入ChatGPT

苹果公司宣布将在12月推出iOS 18.2、iPadOS 18.2和macOS Sequoia 15.2系统更新，引入革命性的AI功能升级，包括Siri首次接入ChatGPT，为用户带来更智能、更便捷的体验。系统强调用户隐私保护，整合顶级AI技术与硬件优势，展现了苹果在AI领域的雄心。

亮点提要：

🔍 Siri将首次接入ChatGPT，用户无需额外注册账户即可免费使用

📝 ChatGPT整合到系统写作工具中，提升创作能力

🔒 苹果采取严格安全措施保护用户隐私，不保存ChatGPT使用记录

详情入口：

🔗 https://www.chinaz.com/ainews/12811.shtml

7. 报道称，Meta 正在研发自家AI搜索引擎，减少对谷歌依赖

最近，据报道，Meta 正在开发一款全新的人工智能搜索引擎，旨在减少对谷歌和微软的依赖。这一举措将为Meta的聊天机器人提供AI生成的时事摘要，进一步深入信息获取领域。科技巨头之间的竞争日益激烈，Meta、苹果、OpenAI等公司都在推出创新产品以满足用户需求。

亮点提要：

🌐 Meta 正在开发AI搜索引擎，减少对谷歌的依赖。

🤖 新的搜索引擎将为Meta的聊天机器人提供AI生成的时事摘要。

📰 Meta与路透社达成合作，让聊天机器人可使用其新闻文章进行回答。

8. 智源推出全能视觉生成模型 OmniGen 集多项能力于一体

北京智源人工智能研究院（BAAI）推出全新全能视觉生成模型OmniGen，标志着图像生成领域重大突破。OmniGen以统一性、简单性和跨任务知识迁移能力著称，可处理多种图像生成任务，包括文生图、图像编辑、主题驱动生成和视觉条件生成。模型简化架构、用户友好操作，无需插件或复杂步骤，能有效跨任务迁移知识，展示新颖功能。

亮点提要：

🌟 OmniGen模型集多项能力于一体，处理多种图像生成任务。

🔑 模型简化架构、用户友好操作，无需额外插件，可完成复杂任务。

💡 OmniGen开源权重和代码，构建大规模统一图像生成数据集X2I，推动通用图像生成领域发展。

详情入口：

🔗 https://arxiv.org/pdf/2409.11340

9. 突破性开源项目：手机也能运行的轻量级数字人来了

近日，一个名为Ultralight-Digital-Human的开源项目成功解决了数字人技术在移动端的部署难题，让普通智能手机也能实时运行数字人应用，为相关技术的普及带来新的可能。该项目采用了创新的深度学习技术，通过算法优化和模型压缩，成功将庞大的数字人系统瘦身到可以在移动设备上流畅运行的程度。

亮点提要：

🔑 创新深度学习技术实现数字人在移动设备上流畅运行

🔑 集成Wenet和Hubert音频特征提取方案，提升数字人唇形同步效果

🔑 提供完整的训练流程文档，让开发者轻松训练自己的数字人模型

详情入口：

🔗 https://github.com/anliyuan/Ultralight-Digital-Human

10. 环球音乐与AI公司携手打造 “有道德” 的AI 音乐生成模型KLayMM

环球音乐集团与Klay Vision合作开发道德音乐生成模型KLayMM，旨在推动可持续AI音乐创作。这一合作标志着音乐行业对AI技术的重视，展示了新的音乐创作方向。

亮点提要：

🎶 UMG与Klay Vision合作推出KLayMM，尊重版权与艺术家权益。

🤝 模型将与音乐行业合作，确保AI内容准确归属与可持续发展。

🌍 Klay Vision建立全球生态系统，促进AI音乐创作与版权变现。

11. 苹果推配备M4的新款iMac Apple Intelligence解锁Mac更多可能

苹果公司发布了全新的iMac，搭载强大的M4芯片和Apple Intelligence，保持超薄设计。新款iMac将于11月8日正式发售，起价1299美元。M4芯片带来显著性能提升，日常生产力提升1.7倍，处理照片编辑和游戏速度提升2.1倍。Apple Intelligence带来全新体验，结合生成模型和隐私保护功能，解锁Mac新方式。

亮点提要：

🚀 M4芯片带来显著性能提升，日常生产力提升1.7倍，处理照片编辑和游戏速度提升2.1倍。

💡 Apple Intelligence结合生成模型和隐私保护功能，为用户解锁Mac新方式。

🎨 新款iMac提供七种鲜艳配色，24英寸4.5K视网膜显示屏、1200万像素Center Stage摄像头等功能。

12. 周鸿祎：AI不该成为超级神明，而应是人类的茶叶蛋

周鸿祎在新浪新闻探索大会上分享了对人工智能发展的独特见解，强调AI应赋能而非简单替代人类，呼吁降低AI应用成本实现产业重塑。他认为中国应走专业化发展道路，与具体行业需求结合，提升生产效率。

亮点提要：

🧠 AI不应成为宇宙超级无敌存在，而应降低应用成本实现产业重塑。

🔮 AI技术目前仅能模拟人脑部分功能，短期内不构成威胁。

💡 AI发展应专业化，如DeepMind的AlphaGo和AlphaFold，在特定领域发挥优势。

13. 预测：生成式AI将产生大量电子废物

近日，剑桥大学和中国科学院的研究人员发表论文指出，到2030年，生成式AI可能每年产生相当于超过10亿部iPhone的电子废物。研究旨在提前了解技术发展带来的后果，提出减少废物的建议。

亮点提要：

🌍 生成式AI预计每年产生超过10亿部iPhone的电子废物

♻️ 减少废物产生的建议包括降级处理和再利用组件

📊 通过采取措施，电子废物产生量可减少16%到86%

关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台

这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程

更多AI硬核内容直接访问AiBase官网，一键开启你的AGI之旅！

官网：https://www.aibase.com/zh/tools/

↓点击阅读原文，进AIbase官网.

http://mp.weixin.qq.com/s?__biz=MzIzNjg3NTUzOA==&mid=2247494654&idx=2&sn=3a0705a7b43f6d7b8f0e21a00e8d2758

AIbase基地

每日AI新闻聚合阅读，掌握AI前沿资讯、AI新品、政策动向，洞察AI行业趋势，深思未来。

AI日报：科大讯飞星火多模态交互大模型上线；腾讯AI智能工作台ima上线Windows版;阿里通义实验室推出代码模式

大升级！ChatGPT Windows桌面版全面上线，macOS版新增与应用协作功能

remove饭碗被砸？免费高清抠图软件RMBG 2.0强力升级复杂背景也能抠干净

AI日报：OpenAI将推首款自主AI代理Operator；腾讯元宝2.0版本上线；AI加持苹果Final Cut Pro11

剁手党狂喜！AI试衣技术Fashion-VDM颠覆传统网购衣服再也不怕踩雷了！

AI日报：阿里海外推AI搜索引擎Accio；Vidu-1.5版本即将上线；百度“自由画布”公测；OpenAI技术大佬Greg回归

AI日报：百度世界2024大会发布文心iRAG和无代码“秒哒”；阿里开源Qwen2.5-Coder全系列

超自然AI换头技术CHANGER，以后再也不怕演员塌房了！

豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真！

AI日报：Suno发布V4音乐生成模型；谷歌最新AI视频制作神器Vids；

还在用百度？让 ChatGPT 成为你的默认搜索引擎，AI 秒搜更智能！

Krea AI上线Lora训练功能我一顿操作猛如虎，结果......

AI日报：快手推“可灵AI”独立APP；百度将推AI智能眼镜；智谱AI开源CogVideoX v1.5并上线“新清影”

AI颠覆服装设计！FLUX.1-dev LoRA 服装生成器来了设计小白也能秒出服装效果图

AI日报：AI助手豆包开启视频生成内测；OpenAI买下Chat.com域名；阿里测试AI动漫创作工具 “Animode”

字节推出单图视频驱动模型 X-Portrait 2 超低成本高效的肖像动画技术

AI日报：InstantX推FLUX图像生成黑科技；面部迁移模型HelloMeme；游戏实时生成算法GameGen-X

黑神话悟空也能用AI生成了？GameGen-X 颠覆游戏开发，传统游戏瑟瑟发抖！

AI日报：腾讯推出Huanyuan-large开源模型；xAI面向开发者推出API；天工AI发布AI高级搜索功能

动画设计福音！Rive推Layouts功能画面自动适配各种屏幕，搞定排版难题！

Diffusion 模型也能“举一反三”？阿里IC-LoRA给图像生成模型增加情节记忆力能力

AI日报：Claude新增PDF文件处理功能；支持视频转视频的开源神器ComfyUI-MochiEdit

告别随机生成！Runway推出高级摄像机控制像导演一样掌控镜头

每天刷无数平台？Follow 一站搞定，只看好内容！

告别“假脸”模特！阿里EcomID重磅来袭原生支持ComfyUI 电商图片要变天？

带图层的AI生图软件来了！Blendbox Alpha 版发布支持实时调光影、改构图

AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT高级语音模式登陆Mac

用AI制作爆火Ins小浣熊自拍视频小红书从0粉到13万粉的暴力增长法则

AI日报：SD轻量级3.5 Medium模型免费开放商用；Hedra 推出全新语音克隆功能；微信灰度测试AI问答功能

小红书博主私藏的AI玩图神器“妙刷”被我找到了!竟然完全免费...

又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

AI日报：神秘AI模型Red_panda横空出世；xAI为Grok添加图像理解功能；更多特效的PixVerse V3发布

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

AI日报：AutoGLM智能体可自动帮点外卖；敏神重磅更新Flux版ic-light模型

工作慢如蜗牛？腾讯会思考的知识库 ima.copilot 一站搞定搜、读、写！

告别PS！Midjourney新增外部图像编辑器还可重绘光影和材质

AI日报：Claude上线数据分析功能；KREA AI推出视频延展功能；美图奇想大模型生图能力升级；苹果悬赏百万寻找AI漏洞

AI日报：科大讯飞星火4.0 Turbo大模型发布；全能型图像生成模型OmniGen问世；iOS18.2 正式接入ChatGPT

简单文本即可创建个性化语音！ElevenLabs 推出全新AI语音生成工具Voice Design

AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；Ideogram上线图片魔法填充功能

Claude3.5重磅升级：Sonnet编码能力秒杀o1，Haiku性价比无敌，还会自己玩电脑！

个人可免费商用！Stability AI发布Stable Diffusion3.5系列文生图模型

AI日报：Rhymes AI开源视频生成模型Allegro；Grok API正式上线；OPPO收购波形智能

ComfyUI发布桌面一键安装包ComfyUI V1 支持自动更新，自动安装Python依赖环境

AI日报：阿里开源文档模型DocOwl 1.5；Midjourney图像编辑器新功能下周上线；Viggle AI推对口型功能

马桶也能装"摄像头"？这家创企要用AI帮你看大便

AI日报：复旦、百度新模型可生成1小时长视频；全新ChatGPT Windows版本上线；NotebookLM又上2个新功能

复旦、百度联手打造全新AI模型Hallo2 可生成4K超高清+1小时超长视频！

AI日报：ChatGPT 月访问量突破 31 亿；英伟达推超快AI图像生成模型Sana；Mistral AI推超强边缘AI模型

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉