大模型推理的加速技术和硬件适配

文摘 2024-11-06 18:04 北京

编译器与AI芯片的协同设计

编译器在MLOps中的作用和集成

新一代AI框架的设计和实现

异构计算资源下的AI框架优化

大模型训练的分布式策略和性能优化

大模型在不同行业的应用案例分析

DataFun 特别策划了 DataFunSummit2024: AI基础软件架构峰会，峰会含有四大重量级论坛，将聚集行业专家、学者及企业领袖，分享他们的研究成果和实践经验，探索 AI 基础软件架构的最新趋势与挑战。

感兴趣的小伙伴欢迎识别二维码免费报名，收看直播：

无论你是架构师、技术决策者，还是大数据与AI领域的从业者，这次峰会都将为你带来无与伦比的学习和交流机会。

扫描海报二维码或点击「阅读原文」即可免费报名，不要错过与AI技术专家一同探索未来的机会！

推荐议题

卞正达北京潞晨科技有限公司 CTO

个人介绍：师从尤洋教授，毕业于新加坡国立大学，现任潞晨科技CTO。曾获NOIP一等奖、华为Code Craft大赛金奖等多项编码大，在全球超算最顶尖会议SC上发表一作论文。7年高性能AI系统经验，Colossal-AI系统核心开发者。

演讲题目：Colossal-AI：AI大模型的挑战与系统优化

演讲介绍：深度学习技术在多个领域取得了突破性进展，但随着模型规模的不断扩大，对硬件资源的需求也日益增加。潞晨科技创造的Colossal-AI深度学习系统，通过集成高效的多维并行系统，异构内存管理系统和推理加速系统，帮助解决大模型大规模训练和推理中的效率和成本问题。Colossal-AI深度学习系统对主流开源模型如ViT, Stable Diffusion, Llama3等提供完善的支持和极致的加速。该系统已在自然语言处理、计算机视觉和生物信息学等领域得到广泛应用，并在ICML、NeurIPS等人工智能领域的顶级学术会议上获得了高度评价和广泛认可。

演讲提纲：

1. 大模型时代的挑战与机遇

2. N维并行和高效内存系统

3. Bnechmark和使用案例

4. Colossal-AI与潞晨云

听众收益：

1. 了解AI发展的最新现状，遇到的问题和潜在的解决方案

2. 了解Colossal-AI和潞晨云的细节与使用方法

落地挑战和方案重点：

1. 大模型训练推理所需资源量巨大，如何减少消耗

2. 高端显卡一卡难求，中小型创业者如何低门槛使用AI

秦续业杭州未来速度科技有限公司联合创始人

个人介绍：未来速度联合创始人 & CEO。公司核心产品 Xinference，提供了开源、企业版和云上版本的高性能大模型推理和部署平台。Xinference 目前已经取得了 5k+ 的 star，有超过 80 个来自全世界的贡献者。

演讲题目：Xinference：企业级大模型推理和部署平台

演讲提纲：

1. 大模型推理的基础知识

2. 大模型部署和推理面临的现状和各种可能困难

3. 现有的大模型推理和部署方案

4. Xinference 大模型推理和部署实践

听众收益：

1. 听众能够对大模型的运行原理和部署有基本了解

2. 听众能了解到大模型部署的一些使用案例

落地挑战和方案重点：

1. 大模型如何高效的在企业中部署，如何结合 AI 开发的生态

2. 文生图等领域如何高效利用资源来提供服务

蔡经纬清华大学交叉信息研究院博士研究生

个人介绍：主要研究方向为大算力多核/chiplet AI加速器的架构和编译器设计，在CCF-A计算机体系结构顶级会议ISCA、HPCA上以第一作者发表文章三篇，获得HPCA2024 Distinguished Artifact Award（1/410），国内首次，获得博士生青年托举项目支持，获得博士生国家奖学金。

演讲题目：识别、探索和理解AI加速器的DRAM通信调度优化空间

演讲介绍：现代AI加速器配备了越来越大的片上缓冲区，以提供更多机会来缓解日益严重的DRAM带宽压力。然而，现有关于缓冲区使用的研究仍主要集中在单层数据流调度优化上。随着缓冲区足够大，可以容纳大多数网络中的单层权重，单层数据流优化对DRAM通信的影响显著降低。因此，开发新的范式以充分利用日益丰富的片上缓冲资源来减少DRAM访问变得尤为重要，但这仍然是一个亟待解决的挑战。

为此，我们提出了细粒度层融合技术，并结合预取和延迟发送两种优化策略，旨在尽可能降低DRAM访问，同时缓解DRAM通信的不平衡。通过全方位优化DRAM通信，我们实现了2.44倍的性能提升。

演讲大纲：

1. 目前片上buffer优化DRAM通讯的技术及局限性

2. 层融合之后数据预取和延迟发送的重要性

3. 对数据的计算粒度和访存粒度进行表达

4. 探索以上定义的优化空间

5. 实验和分析

听众收益：

1. 对于使用片上buffer优化DRAM通讯这个关键问题有更深认识

2. 理解细粒度层融合以及预取以及延迟发送两个优化技术

落地挑战和方案重点：

1. 如何支持尽可能多的算子进行融合

2. 对于超大规模图搜索速度的优化

徐宗泽 DeepWisdom/MetaGPT 合伙人

个人介绍：徐宗泽，DeepWisdom合伙人之一，团队AgentOS事业部经理。佩斯大学硕士，河海大学（在读）博士；在DeepWisdom负责包括电力、零售、金融等多个领域的AI Infra的应用落地；拥有数千万级AI Infra能源项目实践落地经验，MetaGPT团队核心成员。

演讲题目：MetaGPT: Coding Through Chat With Agents

演讲介绍：本演讲将探讨智能体（Agent）技术的发展历程和未来方向。我们将回顾LLM时代主要开源项目，分析过去两年Agent领域的实质性进展，包括推理能力、记忆机制等。我们还将探讨多Agent协作的潜力及其对社会的影响。最后，我们将思考：在AI快速发展的今天，智能体技术将如何塑造我们的未来，我们又该如何引导其发展？

演讲提纲：

1. 过去两年的 LLM 和 Agent

2. LLM Agent 相关的开源项目

3. 通往 Multi-Agent 结局的一些想法

4. 参与开源 Agent 项目的一些建议

听众收益：

1. 洞悉Agent技术发展趋势：了解从单一智能体到多智能体协作的演进，把握行业最新动向。

2. 深入理解技术突破：掌握Agent领域近两年的关键进展，包括推理能力、记忆机制等核心技术的发展。

3. 前瞻性思考与实践指导：探讨多Agent协作对未来的影响，获得参与开源Agent项目的实用建议。

落地挑战和方案重点：

1. o1推理突破：探讨最新的推理技术（包括开源o1），如何显著提升Agent的问题解决能力。

2. 记忆机制创新：介绍情境记忆、程序记忆和动作记忆等新型记忆机制，及其对Agent性能的革命性影响。

3. 自动化学术研究：展示自动实验系统和自动SOP生成等前沿应用，揭示AI如何加速科研进程。

分享赢好礼

http://mp.weixin.qq.com/s?__biz=MzkxMjM2MDIyNQ==&mid=2247635320&idx=2&sn=63ad42dcfaecb9c1b548580ad45689e1

DataFunSummit

DataFun社区旗下账号，专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容，定期提供资料合集下载。

最新文章

参与Flink社区活动，免费赢取FFA大会两日通票～

货拉拉利用大模型打造多场景个人、办公助理实践

CUTLASS跨平台编译及优化技术实践

电子书上新 |《AI for Data：智能数据处理与分析实战》

B站数据安全合规经验总结

DataOps for LLM 的数据工程技术架构实践

揭秘华为数据安全体系建设方法论

人工智能在汽车智能化领域的创新应用实践

电子书上新 |《AI for Data：智能数据处理与分析实战》

AI Agent 在快消行业的最佳实践

腾讯云助力出海企业高效构建全球大数据基础设施

前腾讯数据湖负责人谈如何选择湖上建仓/仓上建湖

电子书上新 |《AI for Data：智能数据处理与分析实战》

ChatBI在车企如何高效落地

数据性能突破：Spark SQL解析层优化技巧与实践

Apache Spark & Paimon Meetup · 北京站，助力 LakeHouse 架构生产落地

蔚来基于RAG的智能问答最佳实践

电子书上新 |《AI for Data：智能数据处理与分析实战》

MatrixOne 2.0.0 向量检索&多模态解析

腾讯分析型 BI+AI 产品 OlaChat 创新探索

AIGA决策大模型在金融风险管理中的实践

从存储到计算：B站AI训练的全链条优化

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

NebulaGraph 的 GraphRAG 进展、实践

数据治理大爆发！这些核心问题你真的了解吗？

深入探讨分布式缓存技术在AI模型开发中的应用

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

智能驾驶时代的汽车数智化转型！

ChatDBA: 数据库根因分析智能助手的实践与应用

数据分析和 AI 能力在汽车制造领域的创新和应用

揭秘数据湖治理：资源管理与血缘关系清晰化的双重策略

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

活动火热报名中｜阿里云&Elastic：AI Search Tech Day

【留言赠书】一篇讲明白LLVM指令调度算法

从0到1，B站AI训练全方位解析

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

新一代AI框架的设计和实现

AIGC 在蚂蚁保保险领域的应用探索

大模型推理的加速技术和硬件适配

小红书云端平台的深度优化策略

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

Pick 最爱的游戏 AI 智能体，抽取大礼！

Agent+RAG：基于大模型的生成式AI落地探索

腾讯大数据实时湖仓智能优化实践

如何提升AI框架数据处理能力的策略

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

异构计算资源下的AI框架优化

百川智能：深度学习大模型推理性能优化策略

Flink CDC 核心源码解析与应用实践

电子书上新 |《Data for AI 实践之路：从数据治理到智能应用》

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉