今日开源(2024-10-31):字节开源MimicTalk代码,基于NeRF技术,15分钟生成3D说话人脸视频

文摘   2024-10-31 18:22   北京  


🛠️框架平台、必备工具

①项目:MimicTalk

MimicTalk是一个能够在几分钟内生成个性化和富有表现力的3D说话人脸的项目。该项目基于NeRF技术,能够快速训练并生成高质量的说话头像。MimicTalk的代码基于之前的Real3D-Portrait项目,支持通过音频驱动生成特定人物的说话头像。

☆一键收藏:

https://sota.jiqizhixin.com/project/mimictalk


②项目:GenAIScript

GenAIScript 是一个强大的脚本环境,专为轻松构建和管理大语言模型(LLM)提示而设计。无论您是开发人员、数据科学家还是研究人员,GenAIScript 都提供了创建、调试和共享脚本所需的工具。它支持 JavaScript 和 TypeScript 编程,允许用户通过定义数据模式和任务来高效地处理和提取数据。

☆一键收藏:

https://sota.jiqizhixin.com/project/genaiscript


③项目:SonicSim

SonicSim是一个合成工具包,旨在为移动声源生成高度可定制的数据。基于Habitat-sim平台开发,支持多层次参数调整,包括场景级、麦克风级和声源级,从而生成更为多样的合成数据。利用SonicSim,我们构建了一个移动声源基准数据集SonicSet,用于评估语音分离和增强模型。

☆一键收藏:

https://sota.jiqizhixin.com/project/sonicsim


④项目:MetaCLIP

MetaCLIP项目旨在通过一种简单的算法形式化CLIP数据的整理过程。该项目的主要贡献包括从头开始整理数据而不依赖于先前模型的过滤,提升训练数据的透明度,并通过可扩展的算法在数据管道中运行,使数据池能够扩展到整个CommonCrawl(CC)中超过300亿的图像-文本对。

☆一键收藏:

https://sota.jiqizhixin.com/project/metaclip


⑤项目:MeetingMind

MeetingMind 是一个由 AI 驱动的会议助手,旨在帮助用户轻松捕获、分析和利用会议洞察。该项目利用 Langflow、Next.js 和基于 Groq 的快速转录服务,能够分析会议并生成有价值的见解。

☆一键收藏:

https://sota.jiqizhixin.com/project/meetingmind


⑥项目:llm-jq

llm-jq 是一个结合了 LLM(大语言模型)和 jq 的工具,旨在帮助用户编写和执行 jq 程序。用户可以通过简单的描述来生成 jq 程序,并对 JSON 数据进行处理和分析。该项目提供了一种高效的方式来处理复杂的数据查询和转换任务。

☆一键收藏:

https://sota.jiqizhixin.com/project/llm-jq


机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章