腾讯混元又悄悄开源两个模型,MoE和3D模型!

文摘   2024-11-05 19:58   广东  


今天,腾讯混元开源了两个模型:最新MoE模型“混元Large”和混元3D生成大模型“Hunyuan3D-1.0”。这两个模型均由腾讯自研,在架构、算法、数据等方面有独特创新,填补了行业空白,并且已经在腾讯业务场景中落地应用。此次开源旨在支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。


01 最新的MoE模型“混元Large”



“混元Large”目前开源领域参数规模最大、效果最好的MoE模型之一(即混合专家模型)。该模型拥有389B的总参数量和52B的激活参数量,上下文长度高达256K



该模型在CMMLU、MMLU、CEval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等九大维度全面领先,超过Llama3.1、Mixtral等一流的开源大模型。腾讯混元Large在模型结构和训练策略方面进行了创新,提升了不同专家的利用率和稳定性,并专项提升了长文处理能力,已应用到腾讯AI助手腾讯元宝上



有什么用?

简单来说就能各种能力上的提升,你提问的各种问题分配不同的专家来回答,相比普通模型,MoE模型具备分布式的专家系统,可以更容易地扩展到非常大的规模,同时保持高效的计算性能。这意味着它可以处理更多的数据和更复杂的任务,而不会显著增加计算成本。


最重要是开源!开源!开源!


Github地址:

https://github.com/Tencent/Tencent-Hunyuan-Large


Hugging Face 地址:

https://huggingface.co/tencent/Tencent-Hunyuan-Large




02 混元3D生成大模型“ Hunyuan3D-1.0”


“Hunyuan3D-1.0”是业界首个同时支持文字、图像生成3D的开源大模型。



它包含轻量版和标准版,轻量版仅需10秒即可生成高质量的3D资产。该模型已经在技术社区公开发布,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。



该模型也具有强大的泛化能力和可控性,可以重建各类尺度的物体,包括建筑、工具、花草等。它在两个公开的3D数据集GSO与OmniObject3D上的效果优于主流开源模型,整体能力属于国际领先水平。


有什么用?

Hunyuan3D-1.0 模型就像是一个3D打印机,但是它不是打印实物,而是打印3D的数字模型。你可以给它一个图片或者一段描述,它就能在短短10秒内生成一个3D的模型。这个模型现在可用于很多领域,比如游戏设计、电影特效、建筑可视化等,它能够快速地创造出逼真的3D场景和物体。想象一下,你想要一个自己设计的家具模型,只需要给它一张草图,它就能帮你生成一个完整的3D模型,还是挺amazing的。


Github 地址:

https://github.com/Tencent/Hunyuan3D-1


Hugging Face 模型地址:

https://huggingface.co/tencent/Hunyuan3D-1




关注公众号,用极客视角洞察未来!

往期精彩文章推荐:

1.首次公布三个月后,OpenAI正式推出ChatGPT search

2.吴恩达 |《The Batch》推出关于AI万圣节特别版文章

3.OpenAI开源多Agent框架Swarm,熬夜实测整理出几大亮点!

GeekSavvy
GeekSavvy是一个新世代AI极客社区,主要覆盖AI极客、创业者和投资人。我们会用Geek视角👉见识行业趋势、洞察AI产品和预见未来科技风向标🚀!
 最新文章