首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

元象开源中国最大MoE模型A36B，可无条件免费商用

科技 2024-09-14 21:39 广东

元象XVERSE近日发布了中国最大的MoE（Mixture of Experts）开源模型——XVERSE-MoE-A36B，此举旨在推动AI应用的低成本部署，并将国产开源技术提升至国际先进水平。

该模型拥有总计255B的参数，其中激活参数为36B，据称其性能可与超100B参数的大模型相媲美，同时训练时间缩短了30%，推理性能提升了100%，显著降低了每token的成本。

元象的“高性能全家桶”系列全部开源，并允许无条件免费商用，此举为众多中小企业、研究者及开发者提供了便利。

MoE架构是一种前沿的技术，它将多个专门针对不同领域的专家模型整合成一个超级模型，从而打破了传统扩展定律的限制。

MoE不仅能够在增加模型规模的同时保持性能最大化，还有可能减少训练和推理所需的计算成本。

因此，谷歌的Gemini-1.5、OpenAI的GPT-4以及马斯克旗下xAI公司的Grok等模型均采用了MoE架构。

元象XVERSE的MoE模型在多项权威评测中表现出色，超越了包括Skywork-MoE、Mixtral-8x22B以及Grok-1-A86B在内的多种同类模型。

此外，元象还推出了基于MoE模型的AI角色扮演与互动网文应用程序Saylo，该程序凭借其真实的AI角色扮演体验和开放性的剧情设置，在港台地区广受欢迎，下载量在中国台湾和香港的娱乐类应用排行榜上名列前茅。

MoE训练方法的优势在于其“高效能、低成本”的特点。

元象在其通用预训练的基础上，利用了海量的剧本数据进行继续预训练，并非传统的监督微调（SFT）或基于人类反馈的强化学习（RLHF）。

相反，他们采取了大规模语料知识注入的方法，使得模型不仅保持了强大的通用语言理解能力，还在剧本这一特定应用领域展现出了显著的改进。

元象是国内领先的AI与3D技术公司，一直致力于推进“通用人工智能（AGI）”的发展。

公司此前已经发布了包含国内最大参数65B、世界最长上下文长度256K以及国内最大参数的MoE开源模型。

这些成果不仅填补了国内相关领域的空白，还推动了国产开源技术走向国际领先水平。

元象的商业应用也取得了显著进展。

作为广东省首批获得国家备案的五个模型之一，元象大模型可以为社会提供广泛的服务。

从2023年起，元象便开始与QQ音乐、虎牙直播、全民K歌、腾讯云等企业展开深入合作，探索AI技术的应用，为文化、娱乐、旅游、金融等领域带来创新的用户体验。

在技术层面，元象围绕MoE模型的效率和效果进行了深入的研究。

他们采用4D拓扑设计来解决MoE架构中的通信瓶颈问题；开发了预丢弃策略以减少不必要的计算和传输；并通过“通信与计算重叠”机制来减少通信延迟。

此外，元象还通过一系列实验确定了最优的专家权重设置方案，以提高模型的训练效果。

在数据处理方面，元象借鉴了“课程学习”的理念，在训练过程中实施动态数据切换。

这使得模型能够不断学习新的高质量数据，增强了数据覆盖范围和泛化能力。

同时，通过调整数据采样的比例，有助于平衡不同数据源对模型性能的影响。

此外，元象还优化了学习率调度策略，以确保模型在引入新数据后能够快速且充分地学习。

经过一系列的设计与优化，元象的MoE模型相比其先前的Dense模型XVERSE-65B-2，在训练时间和推理性能上均有显著提升，达到了行业的先进水平。

开源链接：https://github.com/xverse-ai/XVERSE-MoE-A36B

关注我们：即可加入【AI交流群】，免费领取【AI大礼包】

每日聚焦最新AI，让每个人都能享受到AI带来的乐趣！

最新文章

百度世界2024：发布文心iRAG和无代码工具秒哒

豆包发布国内首款通用图像编辑模型SeedEdit

AMD推出10亿参数开源模型OLMo，性能超越同类产品

字节公布X-Portrait 2，模仿出惟妙惟肖的人物表情

腾讯开源混元MoE和3D大模型，业界首个同时支持文字、图像生成的3D开源大模型

天工AI更新高级搜索功能，可搜索股票、科研信息

Suno推出AI音乐克隆，可复用任意音乐风格

知乎推出专业搜索功能，确保所提供的信息既专业又可靠

AI绘画能力超越FLUX，世界首个能生成长文本图像的模型

小米发布澎湃OS 2，小爱同学升级为超级小爱，体验更加智能

爱诗科技发布PixVerse V3，视频生成技术显著提升，中英文提示词均可理解

智谱推出AutoGLM，AI学会自动操作手机完成日常任务

Claude 3.5大更新，AI学会操作计算机，还能分析数据库

讯飞星火4.0 Turbo发布，多项能力实现领先

Stable Diffusion 3.5发布，消费级硬件开箱即可用

智源开源Emu3多模态大模型，视频理解和生成效果表现优异

百度联合多所高校发布Hallo2，可实现长时间高分辨率音频驱动肖像动画

ChatGPT Windows 桌面程序发布，目前仅特定用户可用

ColorOS 15 发布，以用户为中心的系统级AI升级

联想携手全球AI巨头，推进混合式AI发展

Adobe MAX 2024发布会，Creative Cloud 推出100多项新功能

苹果推出MM1.5大模型，提升AI图像视觉理解能力

Kimi探索版上线，能自主搜索并解决复杂问题

马斯克发布Robotaxi无人驾驶汽车，取消方向盘和踏板

字节扣子全面升级，可一键复制各类型AI模板

AI领域科学家，包揽了诺贝尔物理、化学奖

黑森林实验室发布FLUX 1.1 Pro，目前最先进、最高效的绘画模型

Notion AI发布“一站式”AI助手，可对多平台文件进行分析

猫眼发布“神笔马良”AI，让剧本一键成片

美图MOKI全面开放，三步生成AI创意短片

Llama 3.2发布最强端侧开源模型，手机即可运行

年轻人的第一个对象，东京政府提供AI配对平台

豆包发布AI视频生成模型，提供精准语义理解和高保真画质

基于阿里通义大模型，JetBrains AI编程助手国内发布

可灵1.5版本更新：引入运动笔刷功能，让视频精准运动

无使用次数限制，阿里上线通义万相AI视频平台

豆包推出一套AI音乐生成系统，可多方面控制音乐

元象开源中国最大MoE模型A36B，可无条件免费商用

OpenAI o1发布，理科推理能力超越人类专家博士

国内首家五官科医院，推出AI生成式病历

国家网络安全会发布《人工智能安全治理框架》

苹果发布iPhone 16系列AI手机，Apple Intelligence带来全新交互体验

谷歌AI虚拟试穿，数千件连衣裙任意穿

支付宝推出多个AI助手，理财、生活、健康统统帮你搞定

文心一言APP改名了，升级后覆盖五大生活场景

ComfyUI新版本发布，多项更新优化工作流程

快手发布电商AI换衣神器，想怎么换就怎么换

高性能低功耗，最强SOTA小模型Zamba登场

支持VR实时渲染，实景三维大模型书生3.0开源

Midjourney开放网页端，并宣布进军硬件领域

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉