昨日行业动态丨仅文字就能配音?新一代 AI 语音生成工具 Voice Design 发布!

科技   2024-10-25 13:10   湖北  
 又到周五了,今日想与大家共勉一句话:删掉一大段不满的话,只回复“OK”,也是一种自控力!
关注我,每天几分钟带你掌握设计圈新鲜事,AIGC 趋势早知道!工作日也不无聊,快加星标,轻松获资讯🎁

 今天给大家推荐一个 AI 批量抠图神器,1 秒钟去背几十张,再也不用加班了!

哇!你还在这样用 PS 抠图吗?发现一个超级好用的 AI 批量抠图神器,只需将图片全部拖进这个工具,点击开始,瞬间图片就抠好了。

图片背景被抠的干干净净,再也不用一张一张去背景了,还能一次性打包下载,赶快试试吧! 


1. ElevenLabs 推出 AI 语音生成工具 Voice Design

 ElevenLabs 最新推出的 AI 语音生成工具 Voice Design 开创了 AI 配音领域的新纪元,通过简单的文本描述即可创建个性化语音,为用户提供了直观的文本提示功能,支持调节多个语音参数,包括年龄、性别、口音、语调和音高,同时突破性地支持创作角色化语音,为内容创作者提供了前所未有的声音定制自由。

2. 北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

 北京大学与华南理工大学的研究团队发布了一款名为 FakeShield 的图像篡改检测工具,该工具能够识别图像是否经过伪造,并准确定位篡改区域。它通过结合视觉和语言理解能力,提供详细的检测解释,增强了检测的透明度和泛化性。FakeShield 还构建了多模态篡改描述数据集,提高了模型的分析能力。

3. 微软开始测试照片 AI 超分辨率功能,支持最高 8 倍放大

 微软向搭载高通骁龙芯片的 Copilot+ PC 推出了包含「超分辨率」功能的 Windows 预览版。超分辨率使用 AI 来增强和放大图像,最高可达原始图像尺寸的 8 倍,适合用于改善低质量照片。该功能利用 Copilot+ PC 上的神经处理单元(NPU)来提供增强功能,微软强调所有过程都在本地运行,用户可以从照片编辑器中访问超分辨率功能,号称能在几秒钟的时间内增强图像。

4. OpenAI 聘请第一位首席经济学家 Aaron Chatterji

 OpenAI 聘请了第一位首席经济学家:Aaron Chatterji,他曾为两位美国总统服务,现任杜克大学商业与公共政策教授。Chatterji 将为 OpenAI 研究人工智能造成的经济影响,并领导人工智能如何影响经济增长和就业前景的研究。OpenAI 还任命了前助理副总检察长和 Uber 的合规主管 Scott Schools 为新任首席合规官,将为这家公司就法律要求和道德规范方面进行合作。

5. 苹果推出 iOS 18.2 首个开发者测试版,Siri 接入 ChatGPT

 苹果公司最新发布 iOS 18.2 Beta 1 版本,该版本专为搭载 Apple Intelligence 的设备设计,如 iPhone 15 Pro 系列和 iPhone 16 系列。此次更新中,Siri 与 ChatGPT 技术整合,显著提升了对自然语言的理解和处理能力,能够执行更多应用内操作。同时还引入了 Genmoji 功能,允许开发者创建个性化表情符号。iPhone 16 系列用户将获得视觉智能功能,通过长按相机按钮即可激活。

6. 智谱 AI 推出 AutoGLM-Web,能模拟用户进行网页浏览和交互

 AutoGLM-Web 是一个 AI 浏览器助手,能模拟用户进行网页浏览和交互,执行高级检索、内容总结和邮件回复等任务。AutoGLM-Web 使用自进化在线课程强化学习框架,不断提升性能,不依赖特定 API,适用于多种自动化办公和在线研究场景。目前可通过“智谱清言”插件使用。

7. Zoom AI 助手 2. 0 版本发布,整理会议要点更便捷

 Zoom 最新推出的 AI 助手 2. 0 版本为用户提供了更高效的工作管理和团队协作体验。AI Companion2. 0 不仅能在会议中提供即时帮助,还可以管理邮件和聊天记录,撰写感谢信等,全面提升工作效率。


 以上就是今天的读报内容,大家对当前的内容安排还满意吗?或者说你还想通过这个栏目关注哪些资讯呢?大家可以评论区给一些建议,谢谢!






优设AIGC
优设网,国内专业设计师平台。专注前沿设计趋势和设计方法论,新鲜的AIGC教程及资讯。
 最新文章