6小时完成Llama 3.1-8B适配并开源！MindSpore Transformers大模型套件使能开发者创新

文摘 2024-07-25 09:45 广东

北京时间7月24号, Meta 正式发布 Llama 3.1开源大语言模型, 包含8B、70B 及 405B 参数版本。其中的Llama 3.1 405B模型，在多项基准测试中可以媲美GPT4、Claude3.5等目前最强的闭源大模型。此外，8B 与 70B 参数的 Llama 3.1 模型与其他参数量相似的闭源和开源模型相比，也同样具有竞争力。

6小时完成Llama 3.1适配

开发者基于MindSpore Transformers大模型套件，6小时完成Llama3.1-8b的微调及推理的迁移适配，并将代码开源至Gitee代码平台，面向所有开发者开放体验、调用，后续将同步上传至各大模型社区。

MindSpore Transformers Llama3.1代码仓地址：https://gitee.com/mindspore/mindformers/blob/dev/research/llama3_1

MindSpore代码仓地址：

https://gitee.com/mindspore/mindspore

开发上，基于MindSpore Transformers大模型套件上开箱即用的Llama3进行微调和推理部署，即可得到Llama 3.1。

微调上，开发者利用大模型套件的权重转换工具，一行代码实现huggingface权重一键转化，同时通过使用MindFormers提供的Trainer等高阶易用性接口，仅需修改配置文件即可完成微调适配并成功跑通训练，loss曲线表明微调后训练任务稳定运行。

推理部署上，代码拉取、权重下载、权重转换步骤与微调一致，实现权重一键转换，推理结果显示，基于MindSpore Transformers适配的Llama 3.1模型精度与原生模型精度对齐。

MindSpore Transformers llama3.1开箱流程

微调：

模型跑通后，Loss曲线显示微调任务稳定运行。

推理：

推理结果显示，可以看到基于MindSpore Transformers+昇腾AI处理器适配后的模型推理结果与Llama 3.1原生模型的结果完全一致，实现精度对齐。

关于MindSpore和MindSpore Transformers

昇思MindSpore是华为开源的首个业界全场景AI融合框架，原生支持AI大模型与科学智能。大模型开发套件MindSpore Transformers基于MindSpore内置的并行技术和组件化设计,构建了大模型训练、微调、评估、推理、部署的全流程开发套件，支持业内主流的Transformer类预训练模型和SOTA下游任务应用，可以帮助用户轻松的实现大模型训练和创新研发。

点击阅读原文，进入华为开源官网了解更多

http://mp.weixin.qq.com/s?__biz=Mzg3OTQzMDcwMA==&mid=2247515337&idx=1&sn=2d7ff9515f140737498ee7f269b3c215

华为开源

华为开源文化宣传，活动动态推广。

最新文章

共探产学合作新机遇 | 华为开发者布道师技术沙龙 · 西安站圆满召开

精彩呈现 | 操作系统大会 & openEuler Summit 2024 DB SIG组开放会议

Rust China Tour 武汉站来了

华为甘斌：共筑开源开放生态，共赢智能时代

湾区聚力开源启智 | 华为邀您共聚2024 CCF中国开源大会

CCF开源创新大赛决赛结果发布

COSCon’24 | 华为亮相第九届中国开源年会，共庆开源社10周年

仓颉编程语言官网正式上线！首个公测版本开放下载！

COSCon'24 | 华为技术议题精彩速览，邀你参与第九届中国开源年会

1024程序员节 | 华为与开发者共筑智能应用新生态

华为云开源项目Sermant正式成为CNCF官方项目

1024程序员节 | 华为任旭东：共筑开发者生态，共赢智能时代

数字经济与开源创新共舞，开启经管法教育新篇章——第一届数字经济开源创新学术会议暨经管法高校开源创新教育论坛在上经贸大举行

KubeEdge晋级CNCF毕业项目

60万奖金池！第二届开放原子大赛open-eBackup/Cantian两大赛项火热开启

技术引领筑生态，万物智联创未来第三届OpenHarmony技术大会即将盛大启幕

openHiTLS密码开源社区携手山东大学，共筑密码工程实践新篇章

华为存储开源开放项目亮相2024开放原子开源生态大会

昇思亮相开放原子开源生态大会：原生支持超节点，助力大模型加速训练

openHiTLS社区亮相2024开放原子开源生态大会，助力开源技术发展

2024开放原子开源生态大会 | 推动产业变革，开源赋能AI发展——人工智能开源开放生态分论坛圆满召开

安徽电信基于Cantian引擎的数据库存算分离创新案例正式发布

2024开放原子开源生态大会 | 深耕基础软件，共绘智能时代蓝图

openMind应用使能套件，加速AI社区生态汇聚

2024开放原子开源生态大会 | 华为云共筑智能生态，引领开源创新

@国庆卷王，昇思学习打卡营带你一键掌握AI应用开发全流程

华为全联接大会2024 | 智能化时代下，共筑开源开放AI根生态

openGemini社区人才培养计划：助力成长，培养新一代云原生数据库人才

华为亮相OpenInfra Summit Asia 2024，共绘开源技术设施新篇章

技术与茶香交融，Rust China Tour深圳站Meetup成功举办

Rust China Tour 北京站回顾：技术干货满满，热情互动不断

昇思MindSpore高校学习小组计划启动，欢迎全国高校加入！

华为亮相KubeCon China 2024 ，引领全球智能化新浪潮

首次搭载于量产车型，蔚来汽车 × KubeEdge 创新构建车云协同平台

云原生与AI融合持续深化，华为推动全球智能化新浪潮

开源协作，共筑数字基础设施新时代

精彩预告！Kuasar多沙箱容器运行时KubeCon China 2024技术分享

KubeEdge 邀您共话边云协同AI智算

高纯度云原生 AI！Volcano在KubeCon China 2024的技术分享

华为数据存储用户精英论坛开源生态分论坛圆满落幕

Rust China Tour 深圳站来啦！

OpenTiny HUICharts 正式开源发布，一个简单、易上手的图表组件库

openEuler 社区 2024 年 7 月运作报告

Rust China Tour 北京站又来啦！

你有AI焦虑吗？资深前辈 VS AI新生代，直播解锁AI时代的成长密钥【文末福利】

我参与，我做主 | 他们为openEuler的未来描绘蓝图

「MindSpore SPONGE暑期学校第四季」火热招生中，速来掌握AI+分子动力学新技能

6小时完成Llama 3.1-8B适配并开源！MindSpore Transformers大模型套件使能开发者创新

Kmesh v0.4 发布！迈向大规模Sidecarless服务网格

开源备份软件，共建繁荣生态 | openEuler首场开源备份软件Meetup圆满落幕

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉