Hi,这里是Aitrainee。
众所周知,运行人工智能(AI)程序往往需要依赖英伟达(NVIDIA)的图形处理单元(GPU)。然而,构建一台具备足够GPU性能的计算机,其成本至少需要一万元,这个门槛让不少朋友感到犹豫。
对于那些希望以较低的初期成本快速尝试多种AI算法的朋友来说,选择租赁云服务提供商的GPU资源是一个极佳的解决方案。今天,我想向大家推荐一个GPU云服务平台——趋动云,并且现在正好是他们推出新用户优惠的时期。
通过扫描我的二维码或点击我的链接进行注册,您将立即获得价值10元的免费算力。完成指定任务后,您还有机会额外获得总价值高达190元的算力。这些算力的有效期为一年,而且数量有限,所以先到先得哦。
长按下方专属二维码,然后“注册”即可。
或者也可以直接打开下方的专属注册链接到浏览器里打开:
https://growthdata.virtaicloud.com/t/i2
另外Aitrainee还为大家争取到了更多免费算力,添加下方小助手微信备注Aitrainee 粉丝,将会额外得50元算力金,注册福利加上Aitrainee为粉丝争取的算力福利,总共可以免费得240元算力金。
GPU 云服务器平台好不好,除了性价比,还要看是否好用。
一、趋动云初体验
你是否有看过这样的AI翻译视频?
确实,如今众多开源的语音合成技术已经能够实现多语言的转换,并且能够保留说话者的独特声音特质。回想起多年前,我们观看的那些鬼畜视频,为了使金坷垃、葛平等经典角色能够“唱歌”,制作者们不得不进行复杂的音调调整和音频素材的采集工作。
然而现在,只需简单的一段音频,你就可以获得相同音色下,内容自定的音频了。比如,我们可以通过 FunAudioLLM 算法让坤哥做你的“互联网嘴替”:
甚至,你可以通过一张照片,实现对应的肖像视频。通过 EchoMimic 算法,理塘最強伝說と絕兇の猛虎!純真丁一郎です,参上!
这两个算法都是开源的,但很多想体验的小伙伴在实际使用时都遇到了困难,比如部署有问题,或是机器性能不足。这一次,我制作了完整的教程和懒人包分享!
如果机器性能不足,可以使用云服务器平台白嫖算力,这里我们以趋动云为例。在注册之后,进入社区页面:
选择项目:
在这里我们准备了 FunAudioLLM 的镜像,直接搜索 FunAudioLLM 点击克隆就可以使用了。
FunAudioLLM
稍等片刻等待服务启动之后,我们点击进入开发环境:
这个项目分为 CosyVoice 和 SenseVoice 两个部分,我们先从 CosyVoice 开始。进入目录,找到run.ipynb
文件,点击运行,然后运行所有单元格,稍等片刻后,如果看到这个URL,就说明运行成功了。
然后点击右侧的端口,添加我们启动的这个8081端口,用途输入webui
然后就能看到这个外部访问地址了。这相当于把我们部署好的服务放到了公网上,所有人都可以通过这个地址访问你部署好的服务了。
现在,通过这个地址,我们就可以看到 CosyVoice 的 webui 界面了。在这里,我们可以使用很多功能,比如预训练音色,3s极速复刻等。
预设的声调可以通过输入文本并点击生成按钮来使用,稍作等待,您所需的音频文件就会准备好。若您希望探索更多有趣的声音,只需点击随机种子按钮,即可随机获得一个不同的声调。
接下来,让我们关注3秒快速克隆功能,这非常有趣。您只需提供一段3秒的音频样本,并输入与音频相关的提示内容:
我们将所需合成的文本输入到文本框中,这样就能模仿特定的声线,进而创建出一段音频,其声音与输入的文字内容相匹配。在此过程中,请留意,输入的所有文本都必须包含正确的标点符号。
对于跨语言的声音复刻,操作步骤相似,只需将文本框中的内容替换为另一种语言的文本,同时确保标点符号的使用也是正确的。
自然语言控制,需要在run.ipynb
中更换一下模型,具体操作是,在第一行代码前面加一个井号#
,将其注释掉。然后去掉下面一行的井号。
完成之后,就是下图这样:
然后重新运行所有单元格,按照上面的流程重来一遍即可,自然语言控制的功能可以直接参照webui上的教程。
SenseVoice 的使用方法是相同的,启动run.ipynb
文件,运行之后查看URL,但这里需要输入新的端口。
这里打开地址,就能看到webui了。输入一段音频,点击start,就能识别出音频中的内容了。
这两个项目可以配合使用,我们可以将 SenseVoice 中识别的结果,当作 CosyVoice 的prompt输入,可以省去人工听录音,手动输入音频内容文本这一步。
EchoMimic
该项目不提供云镜像服务,但我们已为您准备了便捷的一键安装包,相关链接位于文档的末尾。使用EchoMimic非常简单,您只需上传所需的图片和音频文件,即可直接生成对应的肖像视频。
请确保您上传的图片分辨率为1024×1024像素,否则可能会引发一些不寻常的错误。对于您的计算机,推荐的显存容量至少为12GB。要启动程序,只需双击启动包内的批处理文件(.bat文件)即可执行。
本次提到的所有内容都在B站进行了完整的视频教程,感兴趣的小伙伴可以部署试试!
B站视频地址:
https://www.bilibili.com/video/BV1DS421X7YQ/
趋动云注册地址:
https://growthdata.virtaicloud.com/t/i2
FunAudioLLM一键运行项目地址https://open.virtaicloud.com/web/project/detail/470526582805655552
EchoMimic本地一键启动包(提取码:jack):https://pan.baidu.com/s/1xIXZ6758mAuE4V5u5LfBxQ?pwd=jack
FunAudioLLM本地一键启动包(提取码:jack):https://pan.baidu.com/s/1OHYl98cQNz5k-vboad4zFg?pwd=jack
二、最后
趋动云 GPU 平台还有非常多的其它 AI 项目可以一键克隆,我仅仅是演示了 FunAudioLLM。
趋动云真的太香了!【Aitrainee】专属注册地址在这里(也可点击左下角阅读原文):
https://growthdata.virtaicloud.com/t/i2
也可长按或扫码注册(注册后,电脑端登录使用):
大家通过我的二维码或者链接来注册,还有价值 10元 的赠送算力,做完任务还能获得总价值 190元的算力。有效期1年,数量有限先到先得。
注册后可在“设置”->"资源配额"处查看当前厂家分配的计算和存储资源:我在账户看到的是16核CPU、48GB内存、2卡GPU
等等。
另外Aitrainee 还为大家争取到了更多免费算力,添加下方小助手微信备注Aitrainee粉丝,将会额外得50元算力金,也可以联系他领取新客任务。
趋动云小助手
简而言之,趋动云的GPU服务器不仅成本效益高,还省去了从头开始搭建开发环境的麻烦,并且提供了大量的公共资源。
用户只需简单操作,即可快速复制所需的算法。
无论是想要探索大型语言模型如ChatGLM2、Llama 2,还是希望通过扩散模型Stable Diffusion创造属于自己的视觉艺术作品,趋动云都能提供强大、灵活且用户友好的计算资源支持。
点击阅读原文即可注册