▎飞桨框架3.0助力用户构建大模型时代核心生产力
飞桨新一代框架3.0是面向大模型、异构多芯进行专属设计,向下适配异构多芯,充分释放硬件潜能;向上一体化支撑大模型的训练、推理。同时具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力,全面地提升了服务产业的能力。获得了产学各界的诸多关注。有了好的技术,如何真正上手,将其技术能力用起来,成为大家当下最实际的诉求。
▎利刃在手,如何找到功法,应用自如?
实践出真知!技术知识的一切问题,代码会给你答案!为了让大家能具体的理解飞桨框架3.0的几大新特性,并且实际上手用起来,GitHub 20万星 Al 项目团队——飞桨官方研发团队亲自带练,携手产学界资深用户共同打磨了本次实测带练营,活动详情如下。
01
活动详情
▎游戏式实测,无痛上手
本次带练活动结合飞桨框架3.0版本的新特性,打磨了一套内容完整、层次丰富的实测任务。任务涵盖最基础的环境安装、编译优化等底层框架能力、模型的自动并行训练技术、高性能推理部署技术、科学计算、大模型辅助编程六大板块,以帮助不同需求的用户使用框架。让大家在逐步解锁一个个小技术任务的过程中,自己动手实际感知飞桨框架3.0的用法和性能,游戏式解锁其超强新能力。
▎现场 coding 带练,包教包会
对于相对较底层的神经网络编译器和基于 PIR 的 Pass 开发技术,以及热度较高的模型自动并行训练技术、高性能推理部署技术,我们准备了三场单独的直播课程。以实用技术概念补充+核心代码逐行解析+现场拆解技术任务并 coding 实现的方式,为产学用户提供高密度知识课堂!
▎框架老粉助攻
用户最懂用户,今天的难点卡点,明天的经验心得。在技术探索的过程中,老用户往往是最好的领路人。本次活动邀请了从飞桨框架早期就一路相伴的初代产业级 PPDE 担任助教,无论你是企业工程师还是高校师生,他们都能站在你的角度引导你梳理问题、给予经验,帮助你高效通关。
▎丰富奖励,证书奖金礼品全都配齐
百度飞桨官方证书、奖学金、高刷显示器、Apple 系列新款,成就感、实用性拉满。解锁 Peaceful、Easy、Normal、Hard 四类不同难度的关卡,获取对应分值,角逐积分奖项!
02
实测内容概览
▎稳扎稳打 六个板块逐一带练
以下任务涵盖日常开发常用板块,可根据自己实际需求选学。另外,除少量开放性任务外,其余实测任务均配套参考代码并会对核心代码进行讲解,全程开卷+实时答疑。不必太担心难度,只要想学,跟着练即可解锁以下阶梯式实测任务!(任务内容概览如下,详情请见官方课程群):
■1.环境安装实测:在任一设备上安装飞桨框架3.0版本。
■2.底层框架实测:
a.编译优化:基于一个子图,跑通编译器全流程。
b.PIR pass 开发:基于 PIR 实现并跑通一个替换类 pass;整体串联,实现性能提升。
c.组合算子:基于飞桨框架3.0在 GPU 环境下优化改造一个算子的拆分逻辑,并跑通。
■3.科学计算实测:基于飞桨框架3.0在任一设备上实现矩形薄板挠曲方程(四阶方程)求解。
■4.模型训练实测:
a.基础训练:基于飞桨框架3.0在任一加速卡上完成任一模型训练。
b.自动并行策略体验:
实现一个 transformer 模型中常见的 FFN 结构(两层 MLP),并跑通。
基于 FFN,使用自动并行 API 将其改写为,在8卡上2路数据并行+2路模型并行+2路流水线并行的三维混合并行,并跑通。
跑通 PaddleNLP 中的自动并行 llama 13B 模型。
■ 5.推理部署实测:
a.基础推理:基于飞桨框架3.0在任一设备上跑通基础推理(限定 Ampere / Ada / Hopper 架构)。
b.跑通更高阶的优化项(如 Fp8量化推理、 4Bit 量化推理、 Block Attention 多 batch 推理等等)。
c.在支持的列表之外新增模型并跑通(如 LLaMA3.2 / Qwen2-VL 等)。
■ 6.大模型辅助编程实测:
a.代码生成:将代码生成能力用在自己日常使用的代码中。
b.代码转换:从示例项目中任选一个,完成代码转换。
▎额外加分:适当户外效率更高 秀出记录可获加分
近年来,越来越多研究佐证了运动户外对效率提升的积极作用。最近超火的“公园20分钟效应”也体现着类似的观点。因此我们鼓励大家在工作学习之余也能到户外动一动,爬山、游泳、公园发呆都可以,用你喜欢的方式!秀出你的户外/运动记录,即可获得官方加分!(特别提示:征服喜马拉雅 VS 公园发呆20分钟,对应分值相同。只希望大家一起去户外放松,适合自己的就是最好的!)
最后,飞桨框架3.0诚挚欢迎产学研各界开发者参与实测,共同构建大模型时代核心生产力!
03
报名方式
扫描海报右下方的二维码,立即报名!