AI Infra:计算通信overlap实战分享

文摘   2025-01-30 13:00   山西  

在4090卡上,通信能力很弱,通信耗时占比很高,导致gpu大部分时间算力浪费,百川是怎么解决的?

见下图:


这些内容是DataFun数据智能知识地图3.0版本-数据建模领域,AI Infra模块的内容。

数据建模领域包括以下内容:

  • 图神经网络在电商推荐系统中的应用

  • 揭秘大厂大模型评测

  • 大模型微调突破

  • 升级版RAG高级检索

  •  Agent技术难点与趋势

  • 多模态

  • LLMOPS方案实施路径及策略

  • 引擎工程 AI Infra:投机采样与通信优化
入群免费下载知识地图3.0


师资简介:
肖彬 百川智能infra部门 高级专家

北京理工大学本硕,先后在搜狗负责推荐架构,在字节跳动负责智能推荐平台训推架构,目前在百川智能负责大模型推理架构研发。

DataFunTalk
专注于大数据、人工智能技术应用的分享与交流。致力于成就百万数据科学家。定期组织技术分享直播,并整理大数据、推荐/搜索算法、广告算法、NLP 自然语言处理算法、智能风控、自动驾驶、机器学习/深度学习等技术应用文章。
 最新文章