AI日报:SD轻量级3.5 Medium模型免费开放商用;Hedra 推出全新语音克隆功能;微信灰度测试AI问答功能

科技   科技   2024-10-30 17:20   福建  
 关注我,记得标星⭐️不迷路
AI日报

10月30日•AIbase

1、Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型

2、Hedra推出全新语音克隆功能,AI虚拟形象发音更真实

3、微信被曝灰度测试AI问答功能

4、ComfyUI新神器ComfyUI-Detail-Daemon:一键提升AI绘画细节

5、Meta 推出新一代视频生成模型 MarDini,搞定填补视频缺失帧任务

6、告别聊天记录混乱!ChatGPT网页版推出聊天记录搜索功能

7、可爱暴击!AI生成Jellycat联名爱马仕玩偶走红,网友直呼梦醒了

8、X用户利用美国选举相关虚假信息和 AI 图像轻松月赚数千美元

9、GitHub引入多款模型和 Spark 平台:人人都能用自然语言开发 AI 应用

10、马斯克的 xAI 势头不减,计划再融资数十亿美元、估值400亿美元

11、亚马逊推AI 编码助手 Q Developer 可集成到开发环境中


1. 免费开放商用!Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型


Stability AI推出全新Stable Diffusion 3.5 Medium模型,实现了高性能与普及性的完美平衡。这款AI绘画工具免费开放商用,采用MMDiT-X架构,解决了普通用户的硬件门槛问题,实现了人人可用的愿景。技术创新方面整合了三种预训练文本编码器,引入QK标准化技术提升训练稳定性,前12个变换层中的双重注意力模块设计显著提升图像质量和排版效果。


亮点提要:

🚀 高性能与普及性完美平衡,免费开放商用,人人可用的AI绘画工具。

💡 MMDiT-X架构,解决普通用户硬件门槛问题,25亿参数设计,9.9GB显存流畅运行。

🔑 技术创新整合三种预训练文本编码器,引入QK标准化技术,双重注意力模块设计显著提升图像质量和排版效果。

详情入口:

🔗 https://huggingface.co/stabilityai/stable-diffusion-3.5-medium




2. Hedra推出全新语音克隆功能,AI虚拟形象发音更真实


最近,备受欢迎的AI角色制作工具Hedra推出了令人激动的语音克隆功能,用户只需录制少量声音即可克隆、存储并应用到所创建或上传的角色上。操作简单易懂,对口型表现优异,嘴部动作准确。付费用户可享受此功能,最低订阅费用为每月10美元。



亮点提要:

✨ 只需录制少量声音即可准确克隆自己的声音,简单易用。

🎨 图像生成器效果出色,生成的角色与真实人脸几乎无法区分,但动物角色的唇同步效果较差。

💰 付费用户可享受语音克隆功能,最低订阅费用为每月10美元。

详情入口:

🔗 https://www.chinaz.com/ainews/12845.shtml




3. 微信被曝灰度测试AI问答功能 官方回应:优化用户搜索体验


近日,微信正在进行灰度测试AI问答功能,旨在优化用户搜索体验并提升搜索效率。该功能整合了腾讯内部的技术资源,包括混元大模型。


亮点提要:

🔍 AI问答功能灰度测试中,用户可通过微信搜索触发,生成约400字回答和5个参考资料。

🔧 测试旨在优化用户搜索体验,提升搜索效率,整合腾讯内部技术资源。

💡 腾讯混元大模型基于Transformer神经网络,拥有万亿参数规模,具备强大的中文创作能力和逻辑推理能力。




4. ComfyUI新神器ComfyUI-Detail-Daemon:一键提升AI绘画细节,Flux模型画质再升级


我对最近引起轰动的ComfyUI-Detail-Daemon插件进行了深入了解。这款由Jonseed开发的工具在AI绘画圈内备受瞩目,它巧妙地将sd-webui-Detail-Daemon移植到ComfyUI平台,为创作者们带来了前所未有的细节优化体验。最令人惊叹的是其强大的细节增强能力,以及对Flux模型作品的出色处理表现。



亮点提要:

⚙️ 强大的细节增强能力,精确调控sigma参数提升图像细节,智能去除散景和背景模糊,特别适用于Flux模型作品。

🔍 配备四个功能各异的核心节点,包括Detail Daemon Sampler、Detail Daemon Graph Sigmas、Multiply Sigmas和Lying Sigma Sampler,简化参数调节流程,提高用户效率。

🚀 简化工作流程,减少技术门槛,通过简单几步实现过去繁琐节点组合所需的效果,提高创作效率。

详情入口:

🔗 https://github.com/Jonseed/ComfyUI-Detail-Daemon




5. Meta 推出新一代视频生成模型 MarDini,搞定填补视频缺失帧任务


Meta 与 KAUST 合作推出的 MarDini 模型让视频创作变得更简单灵活,支持多种任务,如填补视频缺失帧、图像转视频等。该模型采用先进的视频生成技术,灵活性高效率高,能够从零开始训练,处理多种视频任务。



亮点提要:

✨ MarDini 是 Meta 与 KAUST 合作推出的新一代视频生成模型,能够轻松完成多种视频创作任务。

🎥 通过规划和生成模型的结合,MarDini 实现了高效的视频插值和图像转视频生成。

💡 MarDini 以较少的步骤生成高质量视频,提升了创作的灵活性与效率。

详情入口:

🔗 https://mardini-vidgen.github.io/




6. 告别聊天记录混乱!ChatGPT网页版推出聊天记录搜索功能


OpenAI在ChatGPT网络版推出了令人期待的新功能,用户现在可以轻松搜索聊天记录,为用户提供了便利。用户反应积极,期待功能的逐步推出。未来或许会有更多功能更新,提高用户体验。



亮点提要:

🌟 Plus 和 Team 用户将在一天内体验聊天记录搜索功能。

📅 Enterprise 和 Edu 用户一周内获得访问权限,免费用户下月开启。

💻 AI 优先的拉取请求审阅者为开发者提供更智能的支持。

详情入口:

🔗 https://www.chinaz.com/ainews/12836.shtml




7. 可爱暴击!AI生成Jellycat联名爱马仕玩偶走红,网友直呼梦醒了


一场始料未及的联名梦在社交媒体上掀起热议。小红书博主小奶油心利用AI生成的Jellycat与爱马仕联名玩偶图片成功制造了甜蜜的乌龙。网友们对AI创作的奢侈品与萌系玩偶的碰撞充满兴趣,但转化为实物可能面临版权挑战。



亮点提要:

😍 AI生成的Jellycat与爱马仕联名玩偶引发网友热议,展现了奢侈品与萌系玩偶的独特碰撞。

🤔 虚拟联名走红引发现实市场关注,商家表达实体化生产意向,但面临品牌授权等版权挑战。

🚀 AI技术在创意设计领域展示潜力,消费者对萌系奢侈品偏好凸显,但商业化仍需考虑法律与市场约束。

详情入口:

🔗 https://www.chinaz.com/ainews/12833.shtml




8. X用户利用美国选举相关虚假信息和 AI 图像轻松月赚数千美元


在社交媒体平台X上,一些用户利用虚假信息和AI生成的图片,声称每月赚取数千美元。他们通过发布有争议的内容增加曝光和收入,得到高额收入的同时也引发关注和争议。X平台改变收益规则,鼓励用户创作更具争议性的内容,进一步提升用户收益。


亮点提要:

🌟 用户在社交媒体X上分享选举虚假信息,声称每月赚取数千美元。

🤝 X平台改变收益规则,鼓励用户创作更具争议性的内容。

💰 部分用户通过AI生成图像和各种内容,获得了高额收入。




9. GitHub引入多款模型和 Spark 平台:人人都能用自然语言开发 AI 应用


GitHub在Universe '24开发者大会上推出了全新平台GitHub Spark,旨在帮助开发者利用自然语言轻松创建微型应用。同时,提供多种AI模型选择,如Claude3.5Sonnet、Gemini1.5Pro和GPT-4o等。Python超越JavaScript成为GitHub上最流行的编程语言,公共AI项目增长98%。



亮点提要:

✨ GitHub Spark平台助力开发者用自然语言创建AI微型应用。

🛠️ C o p i l o t助理支持多种AI模型选择,可灵活切换。

📈 Python超越JavaScript,成为GitHub上最流行的编程语言,公共AI项目增长98%。




10. 马斯克的 xAI 势头不减,计划再融资数十亿美元、估值400亿美元


马斯克旗下的人工智能公司 xAI 正在蓬勃发展,计划再次融资数十亿美元,估值预计将达到400亿美元。新的融资将进一步提升公司在市场上的地位和竞争力。


亮点提要:

🚀 xAI 正在寻求数十亿美元的新融资,估值预计将达到400亿美元。

💼 公司在5月完成了60亿美元的 B 轮融资,新的融资将大幅提升其市场估值。

🔍 xAI 正在利用大量的 Nvidia GPU 训练新模型,同时 X 平台的隐私政策调整也助力数据利用。




11. 亚马逊推AI 编码助手 Q Developer 可集成到开发环境中


我认为这篇文章介绍了亚马逊推出的 AI 编码助手 Q Developer,它可以集成到开发者的 IDE 中,帮助提高编写代码的效率。这款助手基于 Anthropic 的 Claude3.5Sonnet 模型,能够自动处理代码重构和文档生成,提升开发者工作效率。



亮点提要:

💻 亚马逊推出 Amazon Q Developer AI 助手,支持 IDE 内的直接操作,提升开发者效率。

🤖 Q Developer 基于 Claude3.5Sonnet 模型,能够自动化处理代码重构和文档生成。

🚀 Q Developer 的内联聊天功能在代码重构和文档生成方面表现突出,帮助开发者快速整合修改并保持专注。

详情入口:

🔗 https://aws.amazon.com/cn/blogs/devops/amazon-q-developer-inline-chat/


12美团出品!新晋AI玩图工具“妙刷”:上传图片生成荒诞效果,秒变小黄人、方块人


近日,美团出品了一款名为“妙刷”的AI图片工具悄然走红,这是一款提供新奇、好玩、荒诞的AI视觉体验工具。



亮点提要:

✨ “妙刷” 是一款趣味 AI 图片工具,提供多种荒诞效果。

🎃 用户可上传图片,生成不同主题的创意效果。

 🌟 功能包括图像修饰、音频与视频生成,体验简单易用。




关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台


这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程


更多AI硬核内容直接访问AiBase官网,一键开启你的AGI之旅!


官网:https://www.aibase.com/zh/tools/


点击阅读原文,进AIbase官网.

AIbase基地
每日AI新闻聚合阅读,掌握AI前沿资讯、AI新品、政策动向,洞察AI行业趋势,深思未来。
 最新文章