AlphaFold3 性能速度 & 机器配置

文摘 2024-11-12 00:56 广东

AlphaFold3 的性能表现

跟我一起来探索 AlphaFold3 的世界吧！

原文

https://github.com/google-deepmind/alphafold3/blob/main/docs/performance.md

数据管道

数据管道（即基因序列搜索和模板搜索）的运行时间可能会因输入大小、发现的同源序列数量以及可用硬件（特别是磁盘速度会影响基因搜索速度）而有显著变化。如果您想提高性能，建议提高磁盘速度（例如，通过使用基于RAM的文件系统），或增加可用CPU核心并增加更多并行化。此外，请注意，对于具有深度MSA的序列，Jackhmmer或Nhmmer可能需要超过推荐的64 GB RAM的大量RAM。

模型推理

AlphaFold 3论文的补充信息中的表8提供了在 16卡NVIDIA A100 上配置运行AlphaFold 3的编译无关推理时间，每个设备有40 GB的内存。相比之下，这个仓库支持在单卡NVIDIA A100上运行AlphaFold 3，具有80 GB的内存，并优化了配置以最大化吞吐量。

意思就是：单卡80G A100比16卡 40G A100优化的更好。

我们在下面的表格中比较了这两种设置的编译无关推理时间，使用GPU秒（即使用16个A100时乘以16）。这个仓库中的设置在所有令牌大小上都更高效（至少快2倍），表明它适用于高通量应用。

Token数	单卡A100 80GB (GPU秒)	16卡A100 40GB (GPU秒)	提高倍数
1024	62	352	5.7倍
2048	275	1136	4.1倍
3072	703	2016	2.9倍
4096	1434	3648	2.5倍
5120	2547	5552	2.2倍

分阶段运行管道

run_alphafold.py脚本可以分阶段执行，以优化资源利用率。这可能很有用：

将CPU专用数据管道与模型推理（需要GPU）分开，以优化成本和资源使用。
缓存MSA/模板搜索的结果，然后在不同的种子或不同特征变化（例如，配体）的多次推理中重用增强的JSON文件。

仅数据管道

使用--norun_inference启动run_alphafold.py，生成多重序列比对（MSAs）和模板，而不运行特征化和模型推理。这个阶段在运行时间、CPU和RAM使用方面可能相当昂贵。输出将是增强了MSAs和模板的JSON文件，然后可以直接用作运行推理的输入。

仅特征化和模型推理

使用--norun_data_pipeline启动run_alphafold.py，跳过数据管道，只运行特征化和模型推理。这个阶段需要输入JSON文件包含预先计算的MSAs和模板。

加速器硬件要求

我们官方支持以下配置，并对其进行了广泛的测试，以确保数值精度和吞吐量效率：

单卡 NVIDIA A100 (80 GB)
单卡 NVIDIA H100 (80 GB)

1. NVIDIA A100 (40 GB)

AlphaFold 3可以在单个NVIDIA A100 (40 GB)上运行，需要进行以下配置更改：

启用统一内存。

在model_config.py中调整pair_transition_shard_spec：

  pair_transition_shard_spec: Sequence[_Shape2DType] = (
      (2048, None),
      (3072, 1024),
      (None, 512),
  )

虽然数值准确，但这种配置的吞吐量将低于NVIDIA A100 (80 GB)的设置，因为可用内存较少。

2. NVIDIA V100 (16 GB)

虽然您可以在单个NVIDIA V100上使用--flash_attention_implementation=xla标志在run_alphafold.py上运行AlphaFold 3，处理多达1,280个令牌的序列，但这种配置尚未经过数值精度或吞吐量效率的测试，因此请谨慎操作。

其他标志

1. 编译时间问题的XLA标志解决方案

为了解决已知的XLA问题，导致编译时间大大增加，必须设置以下环境变量（默认在提供的Dockerfile中设置）。

ENV XLA_FLAGS="--xla_gpu_enable_triton_gemm=false"

2. GPU内存

以下环境变量（默认在Dockerfile中设置）允许折叠单个大小高达5,120个 token 的输入，在单个具有80 GB内存的A100上：

ENV XLA_PYTHON_CLIENT_PREALLOCATE=true
ENV XLA_CLIENT_MEM_FRACTION=0.95

统一内存

如果您想在内存较少的GPU上运行AlphaFold 3（例如，具有40 GB内存的A100），我们建议启用统一内存。启用统一内存允许程序在没有足够空间时将GPU内存溢出到主机内存。这可以防止OOM，但代价是程序变慢，因为访问主机内存而不是设备内存。要了解更多信息，请查看NVIDIA博客文章。

https://developer.nvidia.com/blog/unified-memory-cuda-beginners/

您可以通过在Dockerfile中设置以下环境变量来启用统一内存：

ENV XLA_PYTHON_CLIENT_PREALLOCATE=false
ENV TF_FORCE_UNIFIED_MEMORY=true
ENV XLA_CLIENT_MEM_FRACTION=3.2

3. JAX持久化编译缓存

您可能还想使用JAX持久化编译缓存，以避免在运行之间不必要的模型重新编译。您可以在run_alphafold.py中使用--jax_compilation_cache_dir <YOUR_DIRECTORY>标志启用编译缓存。

更详细的说明可在JAX文档

https://jax.readthedocs.io/en/latest/persistent_compilation_cache.html#persistent-compilation-cache

中找到，更具体地说是关于在Google Cloud

https://jax.readthedocs.io/en/latest/persistent_compilation_cache.html#persistent-compilation-cache

上使用的说明。特别是，请注意，如果您想使用非本地文件系统，如Google Cloud Storage，您将需要安装etilshttps://github.com/google/etils

（这在AlphaFold 3 Docker容器中默认不包括）。

AI4Protein

读书破万卷juǎn，专注于AI蛋白相关的学术搬运。

最新文章

Seminar｜多模态生成式蛋白质基础模型

蛋白质功能-序列空间压缩

David Baker｜变构蛋白设计

BioEmu｜生物分子仿真器

RFdiffusion进化史

Seminar｜AI辅助从头酶设计

David Baker｜RFpeptides设计环肽

文章合集

David Baker｜设计含β-strand的Binder

David Baker｜设计IDP的Binder

再看Binder设计

清华大学卢磊课题组招聘化学、生物、计算等方向的博士后与科研助理

Sci. Adv｜语言模型Pro-PRIME设计高稳定性高活性蛋白

直播预告｜去噪蛋白语言模型DePLM助力蛋白进化

读论文时如何辨别出“好东西”

Science｜语言模型 EVOLVEpro 帮助各种蛋白实现定向进化

Nat. Mach. Intell.｜蛋白设计工具预测突变热稳定性

Science｜基因语言模型Evo

GLM｜基因组语言模型的学习笔记

Seminar｜结构感知的蛋白语言模型 SaProt

AlphaFold3 最全食用指南

AlphaFold3 性能速度 & 机器配置

AlphaFold3 的输出的理解

AlphaFold 3 安装指南

AlphaFold 3 权重申请指南

AlphaFold3 的输入

AlphaFold3 开源啦！！！

香港科技大学（广州）人工智能学域助理教授戴恩炎招收AI for Protein 全奖Ph.D. 及 Intern

Foldseek 有何妙用？

RSO｜超越RFdiffusion的蛋白设计方法？

DPLM｜扩散语言模型是多才多艺的蛋白学习者

RSO｜超越RFdiffusion的蛋白设计方法？

AF3｜复现进展

钟博子韬｜2024诺贝尔化学奖解读

BindCraft｜一站式设计高亲和力Binder

Pallatom｜线上报告

PROPREMAB｜预测抗体可开发性的机器学习框架

从零开始造抗体：诺奖技术引领的生物医药新革命！

2024年诺贝尔化学奖，刚刚颁发给了蛋白设计和结构预测

AI蛋白“相关”国内的公司

AI蛋白海内外课题组汇总

Binder设计大赛的结果启示

参数有效微调在蛋白质语言模型中的应用

图解AF3

简述酶的定向进化🦍

ProTrek | 融合多模态信息的蛋白质工具

ProteinBench｜蛋白基础模型最全面BenchMark

蛋白结构和序列的联合设计🤔

AlphaProteo｜从头设计高亲和力Binder蛋白

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉