AI日报:科大讯飞星火4.0 Turbo大模型发布;全能型图像生成模型OmniGen问世;iOS18.2 正式接入ChatGPT

科技   科技   2024-10-24 16:17   福建  
关注我,记得标星⭐️不迷路
AI日报

10月24日•AIbase

1、ElevenLabs推出AI语音生成工具Voice Design

2、吊打ControlNe?全能型图像生成模型OmniGen问世,简单提示实现图像生成与精细编辑

3、科大讯飞星火4.0 Turbo大模型发布

4、OpenAI推全新模型sCM,内容生成速度提升50倍,生图只需0.1秒

5、谷歌开源AI文本水印工具SynthID

6 iOS18.2beta1已经向开发者发布 包含集成的 ChatGPT

7、14岁少年沉迷聊天机器人后不幸离世,Character.AI 和谷歌面临诉讼

8、OpenAI 科学家:20 秒思考能比 10 万倍数据更有效!

9、研究人员开发了新 LLM 越狱方法,成功率高达 65%

10、 苹果发布三款适用于Apple Intelligence的API

11、Zoom发布AI助手2.0版本:提升工作效率


1. ElevenLabs推出AI语音生成工具Voice Design


ElevenLabs最新推出的AI语音生成工具Voice Design开创了AI配音领域的新纪元,通过简单的文本描述即可创建个性化语音,为用户提供了直观的文本提示功能,支持调节多个语音参数,包括年龄、性别、口音、语调和音高,同时突破性地支持创作角色化语音,为内容创作者提供了前所未有的声音定制自由。


亮点提要:

🔊 用户只需描述所需声音特征,系统快速生成符合要求的语音。

🎭 Voice Design支持创作角色化语音,捕捉并还原虚拟角色的声音特征。

🌐 AI语音定制化进入全新阶段,为游戏开发、有声内容制作等领域提供强大的创意工具。

详情入口:

🔗 https://elevenlabs.io/voice-design




2. 吊打ControlNe?全能型图像生成模型OmniGen问世,简单提示实现图像生成与精细编辑


OmniGen是一款全新的图像生成模型,与以往工具不同的是,它具备多种能力,包括文本到图像生成、图像编辑等,用户只需提供简单提示词即可控制图像生成与精细编辑,无需使用插件。该模型架构简化,结合了变分自编码器和预训练的Transformer模型,训练数据集庞大多样,表现优秀。



亮点提要:

⚙️ OmniGen具备多种能力,包括文本到图像生成、图像编辑,用户体验极佳。

🔥 OmniGen采用简化架构,结合变分自编码器和Transformer模型,训练数据集庞大多样,效果出色。

🌟 OmniGen在多项测试中表现惊艳,文本到图像生成能力与市面先进模型相当,图像编辑能力优秀。

详情入口:

🔗 https://huggingface.co/spaces/Shitao/OmniGen




3. 科大讯飞星火4.0 Turbo大模型发布


科大讯飞在全球1024开发者节上展示了讯飞星火4.0Turbo大模型,超越了之前版本和GPT-4Turbo,在数学和编程能力上表现出色,效率提升50%。同时推出了星火代码7B版本和超拟人数字人,实现了语义贯穿的自然交互体验。



亮点提要:

✨ 讯飞星火4.0Turbo在数学和编程能力上超越了GPT-4Turbo,整体效率提升50%。

🔥 在14项主流测试中取得9项第一名成绩,展现出卓越的性能表现。

💡 推出星火代码7B版本和超拟人数字人,实现了多模态交互和更真实的交互体验。



4. OpenAI推全新模型sCM,内容生成速度提升50倍,生图只需0.1秒


OpenAI的研究团队发布了一项令人振奋的研究成果,介绍了全新的连续时间一致性模型(sCM),其生成多媒体内容的速度实现了飞跃,相较传统扩散模型提高了50倍。sCM在不到0.1秒内生成一幅图像,仅需两步采样即可生成高质量样本,未来应用广泛,潜力巨大。


亮点提要:

📈 速度提升50倍,图像生成时间缩短至0.1秒

🖼️ 仅需两步采样,sCM能生成高质量样本,效率显著提高

⚙️ 未来应用广泛,包括实时图像、音频和视频生成,潜力巨大

详情入口:

🔗 https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/




5. 谷歌开源AI文本水印工具SynthID


谷歌最近开源了文本水印工具SynthID,旨在帮助开发者更好地识别AI生成的文本。这一举措对应对虚假信息和不当内容具有重要意义,同时推动了AI技术的发展和应用。



亮点提要:

📜 SynthID开源,助力开发者识别AI生成文本。

🛠️ 水印技术在应对虚假信息和不当内容中愈发重要。

💡 谷歌的SynthID能微调文本生成的概率分数,形成水印。

详情入口:

🔗 https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn




6. iOS18.2beta1已经向开发者发布 包含集成的 ChatGPT


苹果最近发布了 iOS18.2的第一个开发者测试版,增加了一些新的 Apple Intelligence 功能,包括 Genmoji 表情符号、Image Playground 图像生成、AI 驱动的写作功能、ChatGPT 集成和 Visual Intelligence 等。苹果的 Apple Intelligence 功能旨在提供更智能、个性化的体验,但某些功能如让 Siri 了解屏幕内容尚未实现。



亮点提要:


🔍 iOS18.2Beta1中 Siri 正式接入 ChatGPT,增强自然语言理解能力。

 🎨 新增的 Genmoji 和 Image Playground 功能允许用户生成个性化的表情符号和图像。

 📱 Visual Intelligence 功能支持通过 iPhone16相机进行智能搜索,提升信息获取效率。



7. 14岁少年沉迷聊天机器人后不幸离世,Character.AI 和谷歌面临诉讼


这篇文章报道了一名14岁少年因沉迷于与Character.AI的聊天机器人互动而选择结束生命,引发了一场诉讼。文章揭露了Character.AI被指控存在失职和误导行为,涉及提供未经许可的心理治疗以及过度拟人化的聊天机器人设计。同时,Character.AI宣布了一系列新的安全措施以保护未成年用户,减少心理健康风险。


亮点提要:

🔍 诉讼揭露Character.AI和谷歌被指存在失职和误导行为,引发关注和讨论。

💬 被指控提供未经许可的心理治疗,聊天机器人设计过度拟人化,引发道德和法律争议。

🔒 Character.AI宣布新安全措施,包括修改未成年人模型、加入免责声明等,提升用户保护措施。




8. OpenAI 科学家:20 秒思考能比 10 万倍数据更有效!


在最近的 TED AI 大会上,OpenAI 的研究科学家诺亚姆・布朗介绍了 OpenAI 新发布的 o1 模型,强调了系统二思维对于改变各行业决策方式的重要性。布朗指出,20秒的思考时间能带来比10万倍数据更好的效果,而 o1 模型在多个领域展现出卓越性能。他强调 AI 需要超越数据处理,进入更深思熟虑的系统二思维。


亮点提要:

🧠 系统二思维是未来 AI 发展的关键,能提升决策质量。

⏳ 20秒的思考时间能带来比10万倍数据更好的效果。

💡 OpenAI 新发布的 o1 模型在多个领域展现出卓越的性能。




9. 研究人员开发了新 LLM 越狱方法,成功率高达 65%


近日,网络安全公司 Palo Alto Networks 的 Unit42 研究团队发布了一项令人瞩目的研究,揭露了一种名为 “Deceptive Delight”的新型越狱方法。该方法能够在仅仅两到三次交互中,成功诱导大型语言模型(LLM)生成有害内容,其成功率高达65%,为保护 LLM 的安全性敲响了警钟。


亮点提要:


🔒 新型越狱技术“Deceptive Delight”诱导LLM生成有害内容。

📊 研究分析8000案例,发现成功率高达65%,模型间差异显著。 

🛡️ 建议增加内容过滤器和系统提示以增强LLM安全性。




10. 苹果发布三款适用于Apple Intelligence的API


苹果公司最新发布的开发者测试版带来了多项新的 Apple Intelligence 功能,包括 Genmoji、Image Playground、Visual Intelligence、Image Wand 和 ChatGPT 集成合,极大地增强了用户体验。此次更新还推出了三个关键功能的 API,帮助开发者将苹果的小型模型生成 AI 集成到应用程序中。


亮点提要:

🌟 苹果发布 iOS 18.2 等新测试版,推出多项 Apple Intelligence 功能。

🐱 新增的 API 将帮助开发者集成生成式 AI 到应用中。

🌍 扩展的英语本地化支持多个国家,未来将支持更多语言。



11. Zoom发布AI助手2.0版本:轻松整理会议要点


Zoom最新推出的AI助手2.0版本为用户提供了更高效的工作管理和团队协作体验。AI Companion2.0不仅能在会议中提供即时帮助,还可以管理邮件和聊天记录,撰写感谢信等,全面提升工作效率。Zoom向AI优先工作平台迈出重要一步,免费提供给拥有付费账户的用户。



亮点提要:

✨ AI Companion2.0是Zoom新推出的AI助手,旨在提升工作效率。

🤖 用户可以在会议中提问获取即时帮助,并轻松回顾重要信息。

📄 AI助手支持邮件和聊天记录的管理,还能撰写感谢信和生成项目草稿。


关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台


这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程


更多AI硬核内容直接访问AiBase官网,一键开启你的AGI之旅!


官网:https://www.aibase.com/zh/tools/


点击阅读原文,进AIbase官网.

AIbase基地
每日AI新闻聚合阅读,掌握AI前沿资讯、AI新品、政策动向,洞察AI行业趋势,深思未来。
 最新文章