据腾讯介绍,混元Large模型总参数量为389B,激活参数量52B。它采用的MoE(Mixture of Experts)混合专家模型是目前国内外主流的大模型结构。今年年初,混元大模型在国内率先采用MoE架构,性能比上一代Dense模型提升50%。随后腾讯连续推出基于MoE架构的多模态理解大模型以及基础模型“混元turbo”。在模型训练层面,腾讯混元Large构建了覆盖数十个类目的中英文合成数据。合成数据也是今年行业比较流行的概念,主要解决自然数据越来越不够用的问题。康战辉表示,全球目前拥有的自然数据可能会在2026年被全部用完,在未来的大模型训练过程中,合成数据的占比会越来越高,所以高质量的合成数据非常关键,腾讯混元在这方面有一定优势。混元Large模型想要对外展现的另一个重点是它的长文能力。其基于公开数据构建了一套覆盖长文阅读理解、多文档摘要总结和长文逻辑推理领域的数据集企鹅卷轴(PenguinScrolls),用来解决长文领域测评数据集缺乏、方法不够客观等问题。这套企鹅卷轴评测集也将同步对外开放。目前,混元Large模型的长文能力已经在“腾讯元宝”上应用,最大支持256K上下文,相当于一本《三国演义》的内容长度。本次腾讯推出的另一款开源模型——Hunyuan3D-1.0则瞄准现有的3D生成模型在生成速度和泛化能力上存在不足的问题,强调泛化能力和可控性,能重建大到建筑、小到工具、花草的各类尺度物体,帮助开发者自动化生产3D资产。腾讯混元3D生成大模型的首批开源模型包含轻量版和标准版,其中轻量版据称10秒就能生成高质量3D资产,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。目前,3D生成相关技术已经在腾讯内部大量业务中应用,包括UGC 3D创作、商品素材合成、游戏3D资产生成等场景。