震撼揭秘：仅需15秒，打造你的声音分身！

乐活科技 2024-03-30 11:25 江苏

对于声音的研究要比文字的更谨慎，因为声音这种技术一旦被滥用，很容易造成不可控的风险。

这是它的效果之一：可以将参考的音频转换成各种语言版本。

OpenAI的这个Voice Engine的声音克隆技术，其实放眼全世界范围内，也不算新东西了。

比如最简单的，剪映就上线了五秒钟克隆自己声音的功能，你只需要上传五秒自己的声音，就可以克隆一个自己。

这要比OpenAI的15秒还要简单易用。

不过这类型功能的应用倒是挺多的，比如说GPT4在移动端版本的语音功能，就是用到了这个功能，方便懒得打字和无法打字的人也能很舒服的用GPT。

它的几个不同音色也间接的反应了不同音色声音的训练或者使用方式。

在OpenAI的博客中，还提到了几个使用方法。

为了帮助不同背景的读者和儿童，教育技术公司Age of Learning采用了富有情感且自然流畅的声音技术，生成了广泛的预编配音内容。他们结合了Voice Engine和GPT-4，实时创造个性化反应，与学生互动，扩大了他们的受众范围。
翻译服务也通过这些技术得到提升。HeyGen，一个AI视觉叙事平台，利用Voice Engine为全球观众创造多语言视频内容，保持演讲者的原始口音。这让创作者和企业可以以更自然的方式触及更广泛的受众。
Dimagi为偏远地区的社区卫生工作者开发工具，使用Voice Engine和GPT-4提供各种语言的互动反馈，改进基本服务的交付。
Livox通过其AI替代通讯应用，为不能言语的人提供了多语言的、个性化的声音选择，使他们能够以独特且非机械的方式交流。
最后，Lifespan的Norman Prince Neurosciences Institute利用Voice Engine帮助言语障碍患者恢复声音。借助短暂的音频样本，医生们成功恢复了一位年轻患者的声音，她因脑部疾病失去了说话能力。

最后一个挺有意义的，言语障碍患者可以用OpenAI的这个Voice Engine来恢复自己的声音，方法非常的简单，只需要提供一个参考的声音。

你可以听到患者的声音其实非常的模糊不清，但是经过这个engine一润色，立马变得跟常人无异。

但说回来，音频生成、克隆更棘手的点，其实是法律法规以及滥用的风险。

比如各种声纹识别验证的机制，就不太可行的，因为声音的比较容易被模仿的。

Phasing out voice based authentication as a security measure for accessing bank accounts and other sensitive information.

OpenAI也强调了这一点。

- 逐步淘汰以声音为基础的认证作为获取银行账户和其他敏感信息的安全措施。

还有另外两个：

Educating the public in understanding the capabilities and limitations of AI technologies, including the possibility of deceptive AI content.

- 教育公众理解AI技术的能力和局限性，包括欺骗性AI内容的可能性。

Accelerating the development and adoption of techniques for tracking the origin of audiovisual content, so it's always clear when you're interacting with a real person or with an AI.

- 加快追踪音视频内容来源的技术发展和采用，以便始终清楚你是在与真人还是AI互动。

说白了，新的技术最先被应用的场景一定是诈骗以及各种灰产。

http://mp.weixin.qq.com/s?__biz=MzAwNzMwOTcyNQ==&mid=2455657402&idx=1&sn=0d7af0b6b7ae88948631e0c95d49f7f8

平凡的平凡

偶然所做。

最新文章

大学生在校期间可以享受的优惠甚至免费服务有很多，云服务器绝对是其中之一

每一个考入名校的人，其实手里都有一沓兑奖券

英语单词背不下来只有一个原因，就是懒

假的！黎曼猜想被马斯克的AI公司解决纯属博眼球，真相不过是一个恶作剧

你的科研工具箱更新了哪些新工具？

为什么马斯克会觉得大部分学术论文是没用的？

为什么你编写不出优秀的ChatGPT提示词?

「防自学」教材的最大克星，AI工具可以挖出隐藏知识点

为什么有人说「获取学历的速度赶不上学历贬值的速度」？

目前大环境下，去读博是否是个比较好的选择呢？

AI时代还有必要学计算机编程吗？Python是否还是最优选

本科生科研能力的两种路子：有靠山，靠自己，还是做曹原那样的天才？

怎么看待大学里很水的老师？

博士学位，就是一种明码标价的商品，不必神话它

读博期间如何保持科研干劲避免burn out？

计算机是最难的工科吗？

如何理解“英语+一门技能=王炸”？

深度体验Cursor三周后，这3个tips一定要注意

除了ChatGPT，还有哪些好用的AI工具？

普通人如何抓住AI这个风口?

小红书的封闭内容都可以被搜索的到？AI搜索引擎太强悍了

学生该不该买ChatGPT?

暑假后高达一万的天价账单，刺痛了多少“寒门父母”?

LLM大模型的微调原理以及ChatGPT的API微调操作实践

AI 发展真的会让大部分人失业吗？普通人如何用 AI 提升工作效率？

GPT4o被证实有了中度自我意识，那离强人工智能还远吗？

目前AI领域的自媒体怎么赚钱呢？

学历贬值太快，这类学校的研究生就业可能不如本科

AI公司的“养鱼”战术：免费服务背后的长线布局

揭秘国内大厂高薪招聘：顶尖人才争夺战

AI搜索引擎的结果可信度并没有多高

AI写的内容，确实太容易分辨了

用AI写小说可能是下一次风口

为什么AI眼中9.11大于9.9呢？

老外这次是真的惊了，中国版Sora，可灵开放全球测试

别再被AI忽悠了！手把手教你写出杀手级Prompt

为什么全球只有中美能领先AI创新？

如何看待斯坦福大学报告称：中国人对AI态度最为积极

李彦宏：开源模型是智商税？

AI发展到现在，国内大模型行业还有哪些机会？

为什么这波 AI 浪潮没有带来大量的就业岗位

详细教程：自定义大模型之微调ChatGPT

AI搜索引擎，一个普通搜索引擎的二道贩子

AI 时代，高考选什么专业比较有前景？

聊聊姜萍那套题

卷起来，用AI写高考作文啦

AI时代，对于汉语编程来说是危机还是机遇?

如何让大语言模型输出JSON格式？

通义千问2.5发布：开源大模型中文智能程度直逼GPT4

分享10款能够自动生成视频的AI软件

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉