AI日报：科大讯飞星火4.0 Turbo大模型发布；全能型图像生成模型OmniGen问世；iOS18.2 正式接入ChatGPT

科技科技 2024-10-24 16:17 福建

‍关注我，记得标星⭐️不迷路

AI日报

10月24日•AIbase

1、ElevenLabs推出AI语音生成工具Voice Design

2、吊打ControlNe？全能型图像生成模型OmniGen问世，简单提示实现图像生成与精细编辑

3、科大讯飞星火4.0 Turbo大模型发布

4、OpenAI推全新模型sCM，内容生成速度提升50倍，生图只需0.1秒

5、谷歌开源AI文本水印工具SynthID

6 、iOS18.2beta1已经向开发者发布包含集成的 ChatGPT

7、14岁少年沉迷聊天机器人后不幸离世，Character.AI 和谷歌面临诉讼

8、OpenAI 科学家：20 秒思考能比 10 万倍数据更有效！

9、研究人员开发了新 LLM 越狱方法，成功率高达 65%

10、苹果发布三款适用于Apple Intelligence的API

11、Zoom发布AI助手2.0版本：提升工作效率

1. ElevenLabs推出AI语音生成工具Voice Design

ElevenLabs最新推出的AI语音生成工具Voice Design开创了AI配音领域的新纪元，通过简单的文本描述即可创建个性化语音，为用户提供了直观的文本提示功能，支持调节多个语音参数，包括年龄、性别、口音、语调和音高，同时突破性地支持创作角色化语音，为内容创作者提供了前所未有的声音定制自由。

亮点提要：

🔊 用户只需描述所需声音特征，系统快速生成符合要求的语音。

🎭 Voice Design支持创作角色化语音，捕捉并还原虚拟角色的声音特征。

🌐 AI语音定制化进入全新阶段，为游戏开发、有声内容制作等领域提供强大的创意工具。

详情入口：

🔗 https://elevenlabs.io/voice-design

2. 吊打ControlNe？全能型图像生成模型OmniGen问世，简单提示实现图像生成与精细编辑

OmniGen是一款全新的图像生成模型，与以往工具不同的是，它具备多种能力，包括文本到图像生成、图像编辑等，用户只需提供简单提示词即可控制图像生成与精细编辑，无需使用插件。该模型架构简化，结合了变分自编码器和预训练的Transformer模型，训练数据集庞大多样，表现优秀。

亮点提要：

⚙️ OmniGen具备多种能力，包括文本到图像生成、图像编辑，用户体验极佳。

🔥 OmniGen采用简化架构，结合变分自编码器和Transformer模型，训练数据集庞大多样，效果出色。

🌟 OmniGen在多项测试中表现惊艳，文本到图像生成能力与市面先进模型相当，图像编辑能力优秀。

详情入口：

🔗 https://huggingface.co/spaces/Shitao/OmniGen

3. 科大讯飞星火4.0 Turbo大模型发布

科大讯飞在全球1024开发者节上展示了讯飞星火4.0Turbo大模型，超越了之前版本和GPT-4Turbo，在数学和编程能力上表现出色，效率提升50%。同时推出了星火代码7B版本和超拟人数字人，实现了语义贯穿的自然交互体验。

亮点提要：

✨ 讯飞星火4.0Turbo在数学和编程能力上超越了GPT-4Turbo，整体效率提升50%。

🔥 在14项主流测试中取得9项第一名成绩，展现出卓越的性能表现。

💡 推出星火代码7B版本和超拟人数字人，实现了多模态交互和更真实的交互体验。

4. OpenAI推全新模型sCM，内容生成速度提升50倍，生图只需0.1秒

OpenAI的研究团队发布了一项令人振奋的研究成果，介绍了全新的连续时间一致性模型（sCM），其生成多媒体内容的速度实现了飞跃，相较传统扩散模型提高了50倍。sCM在不到0.1秒内生成一幅图像，仅需两步采样即可生成高质量样本，未来应用广泛，潜力巨大。

亮点提要：

📈 速度提升50倍，图像生成时间缩短至0.1秒

🖼️ 仅需两步采样，sCM能生成高质量样本，效率显著提高

⚙️ 未来应用广泛，包括实时图像、音频和视频生成，潜力巨大

详情入口：

🔗 https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

5. 谷歌开源AI文本水印工具SynthID

谷歌最近开源了文本水印工具SynthID，旨在帮助开发者更好地识别AI生成的文本。这一举措对应对虚假信息和不当内容具有重要意义，同时推动了AI技术的发展和应用。

亮点提要：

📜 SynthID开源，助力开发者识别AI生成文本。

🛠️ 水印技术在应对虚假信息和不当内容中愈发重要。

💡 谷歌的SynthID能微调文本生成的概率分数，形成水印。

详情入口：

🔗 https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn

6. iOS18.2beta1已经向开发者发布包含集成的 ChatGPT

苹果最近发布了 iOS18.2的第一个开发者测试版，增加了一些新的 Apple Intelligence 功能，包括 Genmoji 表情符号、Image Playground 图像生成、AI 驱动的写作功能、ChatGPT 集成和 Visual Intelligence 等。苹果的 Apple Intelligence 功能旨在提供更智能、个性化的体验，但某些功能如让 Siri 了解屏幕内容尚未实现。

亮点提要：

🔍 iOS18.2Beta1中 Siri 正式接入 ChatGPT，增强自然语言理解能力。

🎨 新增的 Genmoji 和 Image Playground 功能允许用户生成个性化的表情符号和图像。

📱 Visual Intelligence 功能支持通过 iPhone16相机进行智能搜索，提升信息获取效率。

7. 14岁少年沉迷聊天机器人后不幸离世，Character.AI 和谷歌面临诉讼

这篇文章报道了一名14岁少年因沉迷于与Character.AI的聊天机器人互动而选择结束生命，引发了一场诉讼。文章揭露了Character.AI被指控存在失职和误导行为，涉及提供未经许可的心理治疗以及过度拟人化的聊天机器人设计。同时，Character.AI宣布了一系列新的安全措施以保护未成年用户，减少心理健康风险。

亮点提要：

🔍 诉讼揭露Character.AI和谷歌被指存在失职和误导行为，引发关注和讨论。

💬 被指控提供未经许可的心理治疗，聊天机器人设计过度拟人化，引发道德和法律争议。

🔒 Character.AI宣布新安全措施，包括修改未成年人模型、加入免责声明等，提升用户保护措施。

8. OpenAI 科学家：20 秒思考能比 10 万倍数据更有效！

在最近的 TED AI 大会上，OpenAI 的研究科学家诺亚姆・布朗介绍了 OpenAI 新发布的 o1 模型，强调了系统二思维对于改变各行业决策方式的重要性。布朗指出，20秒的思考时间能带来比10万倍数据更好的效果，而 o1 模型在多个领域展现出卓越性能。他强调 AI 需要超越数据处理，进入更深思熟虑的系统二思维。

亮点提要：

🧠 系统二思维是未来 AI 发展的关键，能提升决策质量。

⏳ 20秒的思考时间能带来比10万倍数据更好的效果。

💡 OpenAI 新发布的 o1 模型在多个领域展现出卓越的性能。

9. 研究人员开发了新 LLM 越狱方法，成功率高达 65%

近日，网络安全公司 Palo Alto Networks 的 Unit42 研究团队发布了一项令人瞩目的研究，揭露了一种名为 “Deceptive Delight”的新型越狱方法。该方法能够在仅仅两到三次交互中，成功诱导大型语言模型（LLM）生成有害内容，其成功率高达65%，为保护 LLM 的安全性敲响了警钟。

亮点提要：

🔒 新型越狱技术“Deceptive Delight”诱导LLM生成有害内容。

📊 研究分析8000案例，发现成功率高达65%，模型间差异显著。

🛡️ 建议增加内容过滤器和系统提示以增强LLM安全性。

10. 苹果发布三款适用于Apple Intelligence的API

苹果公司最新发布的开发者测试版带来了多项新的 Apple Intelligence 功能，包括 Genmoji、Image Playground、Visual Intelligence、Image Wand 和 ChatGPT 集成合，极大地增强了用户体验。此次更新还推出了三个关键功能的 API，帮助开发者将苹果的小型模型生成 AI 集成到应用程序中。

亮点提要：

🌟 苹果发布 iOS 18.2 等新测试版，推出多项 Apple Intelligence 功能。

🐱 新增的 API 将帮助开发者集成生成式 AI 到应用中。

🌍 扩展的英语本地化支持多个国家，未来将支持更多语言。

11. Zoom发布AI助手2.0版本:轻松整理会议要点

Zoom最新推出的AI助手2.0版本为用户提供了更高效的工作管理和团队协作体验。AI Companion2.0不仅能在会议中提供即时帮助，还可以管理邮件和聊天记录，撰写感谢信等，全面提升工作效率。Zoom向AI优先工作平台迈出重要一步，免费提供给拥有付费账户的用户。

亮点提要：

✨ AI Companion2.0是Zoom新推出的AI助手，旨在提升工作效率。

🤖 用户可以在会议中提问获取即时帮助，并轻松回顾重要信息。

📄 AI助手支持邮件和聊天记录的管理，还能撰写感谢信和生成项目草稿。

关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台

这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程

更多AI硬核内容直接访问AiBase官网，一键开启你的AGI之旅！

官网：https://www.aibase.com/zh/tools/

↓点击阅读原文，进AIbase官网.

http://mp.weixin.qq.com/s?__biz=MzIzNjg3NTUzOA==&mid=2247494493&idx=1&sn=226daee18469b6633ec2d079717d6ce0

AIbase基地

每日AI新闻聚合阅读，掌握AI前沿资讯、AI新品、政策动向，洞察AI行业趋势，深思未来。

AI日报：科大讯飞星火多模态交互大模型上线；腾讯AI智能工作台ima上线Windows版;阿里通义实验室推出代码模式

大升级！ChatGPT Windows桌面版全面上线，macOS版新增与应用协作功能

remove饭碗被砸？免费高清抠图软件RMBG 2.0强力升级复杂背景也能抠干净

AI日报：OpenAI将推首款自主AI代理Operator；腾讯元宝2.0版本上线；AI加持苹果Final Cut Pro11

剁手党狂喜！AI试衣技术Fashion-VDM颠覆传统网购衣服再也不怕踩雷了！

AI日报：阿里海外推AI搜索引擎Accio；Vidu-1.5版本即将上线；百度“自由画布”公测；OpenAI技术大佬Greg回归

AI日报：百度世界2024大会发布文心iRAG和无代码“秒哒”；阿里开源Qwen2.5-Coder全系列

超自然AI换头技术CHANGER，以后再也不怕演员塌房了！

豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真！

AI日报：Suno发布V4音乐生成模型；谷歌最新AI视频制作神器Vids；

还在用百度？让 ChatGPT 成为你的默认搜索引擎，AI 秒搜更智能！

Krea AI上线Lora训练功能我一顿操作猛如虎，结果......

AI日报：快手推“可灵AI”独立APP；百度将推AI智能眼镜；智谱AI开源CogVideoX v1.5并上线“新清影”

AI颠覆服装设计！FLUX.1-dev LoRA 服装生成器来了设计小白也能秒出服装效果图

AI日报：AI助手豆包开启视频生成内测；OpenAI买下Chat.com域名；阿里测试AI动漫创作工具 “Animode”

字节推出单图视频驱动模型 X-Portrait 2 超低成本高效的肖像动画技术

AI日报：InstantX推FLUX图像生成黑科技；面部迁移模型HelloMeme；游戏实时生成算法GameGen-X

黑神话悟空也能用AI生成了？GameGen-X 颠覆游戏开发，传统游戏瑟瑟发抖！

AI日报：腾讯推出Huanyuan-large开源模型；xAI面向开发者推出API；天工AI发布AI高级搜索功能

动画设计福音！Rive推Layouts功能画面自动适配各种屏幕，搞定排版难题！

Diffusion 模型也能“举一反三”？阿里IC-LoRA给图像生成模型增加情节记忆力能力

AI日报：Claude新增PDF文件处理功能；支持视频转视频的开源神器ComfyUI-MochiEdit

告别随机生成！Runway推出高级摄像机控制像导演一样掌控镜头

每天刷无数平台？Follow 一站搞定，只看好内容！

告别“假脸”模特！阿里EcomID重磅来袭原生支持ComfyUI 电商图片要变天？

带图层的AI生图软件来了！Blendbox Alpha 版发布支持实时调光影、改构图

AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT高级语音模式登陆Mac

用AI制作爆火Ins小浣熊自拍视频小红书从0粉到13万粉的暴力增长法则

AI日报：SD轻量级3.5 Medium模型免费开放商用；Hedra 推出全新语音克隆功能；微信灰度测试AI问答功能

小红书博主私藏的AI玩图神器“妙刷”被我找到了!竟然完全免费...

又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

AI日报：神秘AI模型Red_panda横空出世；xAI为Grok添加图像理解功能；更多特效的PixVerse V3发布

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

AI日报：AutoGLM智能体可自动帮点外卖；敏神重磅更新Flux版ic-light模型

工作慢如蜗牛？腾讯会思考的知识库 ima.copilot 一站搞定搜、读、写！

告别PS！Midjourney新增外部图像编辑器还可重绘光影和材质

AI日报：Claude上线数据分析功能；KREA AI推出视频延展功能；美图奇想大模型生图能力升级；苹果悬赏百万寻找AI漏洞

AI日报：科大讯飞星火4.0 Turbo大模型发布；全能型图像生成模型OmniGen问世；iOS18.2 正式接入ChatGPT

简单文本即可创建个性化语音！ElevenLabs 推出全新AI语音生成工具Voice Design

AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；Ideogram上线图片魔法填充功能

Claude3.5重磅升级：Sonnet编码能力秒杀o1，Haiku性价比无敌，还会自己玩电脑！

个人可免费商用！Stability AI发布Stable Diffusion3.5系列文生图模型

AI日报：Rhymes AI开源视频生成模型Allegro；Grok API正式上线；OPPO收购波形智能

ComfyUI发布桌面一键安装包ComfyUI V1 支持自动更新，自动安装Python依赖环境

AI日报：阿里开源文档模型DocOwl 1.5；Midjourney图像编辑器新功能下周上线；Viggle AI推对口型功能

马桶也能装"摄像头"？这家创企要用AI帮你看大便

AI日报：复旦、百度新模型可生成1小时长视频；全新ChatGPT Windows版本上线；NotebookLM又上2个新功能

复旦、百度联手打造全新AI模型Hallo2 可生成4K超高清+1小时超长视频！

AI日报：ChatGPT 月访问量突破 31 亿；英伟达推超快AI图像生成模型Sana；Mistral AI推超强边缘AI模型

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉