生命科学领域高性能计算的价值和挑战
在生命科学领域,从基因组学分析到药物研发,高性能计算(以下简称“HPC”)发挥着举足轻重的重要作用。在基因组学分析过程中,HPC可以快速处理和分析大规模基因组数据,帮助研究人员更快获得基因组洞察,对于疾病研究和个性化医疗具有重要意义;在药物研发方面,HPC用于虚拟药物筛选、分子对接和蛋白质结构预测等复杂计算任务。由于这些任务需要处理海量数据并进行高强度计算,HPC的应用可以显著缩短新药研发周期,降低研发成本,从而为生命科学研究提供有力支持。
HPC环境是一个复杂而庞大的生态系统,管理和运维HPC平台并确保系统稳定高效运行对企业来说面临非常大的挑战。如何减少行业客户管理和运维HPC任务的难度,降低使用过程中的学习成本,以及更好地释放HPC环境的强大计算能力,这些都是企业在使用HPC时面临的挑战。
亚马逊云科技赋能HPC
针对客户需求和面临的挑战,亚马逊云科技提供了广泛且深入的计算、网络、存储、安全、云编排和可视化服务,结合丰富的合作伙伴生态系统,能够运行高度定制化和性能优化的HPC任务,全面支持生命科学领域的多样化工作负载。借助亚马逊云科技,客户可以在几分钟内启动由海量算力构成的HPC集群,加速基因组学、计算化学、数据科学、影像组学等领域的创新进程,并且仅需为实际使用的资源付费。亚马逊云科技还为不同客户群体提供针对性更强的服务能力,确保满足其特定需求,助力业务高效发展和创新突破。
基础设施层
在基础设施层,亚马逊云科技提供了超过800种实例类型并涵盖多种GPU类型,以满足不同计算需求。此外,亚马逊云科技还提供丰富的存储解决方案和数据传输工具,确保客户能够高效、安全地进行数据存储和传输。通过这些灵活的基础设施服务,客户可以轻松应对多样化的数据处理场景。亚马逊云科技的可视化管理工具进一步简化了任务的提交与结果的监控,使用户能够直观地管理和优化其云端工作负载,提升运营效率和业务敏捷性。
HPC平台层
在HPC平台层,亚马逊云科技根据客户的多样化业务需求提供了多种定制化解决方案,包括基于传统集群的Amazon ParallelCluster和Amazon SOCA方案,以及基于容器的Amazon Batch和Amazon HealthOmics方案。同时,全面支持多种HPC框架,以确保客户能够灵活应对复杂的计算任务。此外,亚马逊云科技还提供了丰富的集群监控和运维管理工具,大幅提升了用户的运维效率。
应用构建层
在应用构建层,无论是在组学分析、药物研发还是影像组学领域,亚马逊云科技凭借多年深耕行业所积累的丰富经验,依托HPC平台良好的兼容性和可扩展性,为用户提供了可以快速构建和基于特定场景的应用和解决方案,从而快速开展分析工作,助力客户加速创新。
Amazon ParallelCluster UI简化集群管理
Amazon ParallelCluster是HPC领域广泛应用的开源集群管理工具,能够帮助用户轻松在亚马逊云科技上部署和管理HPC集群。为进一步降低用户在创建、管理和监控Amazon ParallelCluster集群时的操作复杂性,亚马逊云科技推出了Amazon ParallelCluster UI。该工具是一个基于Web的可视化管理界面,作为集群创建、监控和管理的集中控制面板,与Amazon ParallelCluster深度集成。通过Amazon ParallelCluster UI,用户可以轻松创建、更新和访问HPC集群,大幅减少了管理和运维云上HPC环境的技术门槛与复杂性。
Amazon ParallelCluster UI提供了一系列功能,旨在简化HPC集群的创建、管理和监控。以下是其主要功能:
集群管理:
查看所有Amazon ParallelCluster集群,包括每个集群的详细信息和当前状态。
集群状态监控:
监控Amazon ParallelCluster集群日志,及时了解集群的运行状况和潜在问题。
作业管理:
查看在集群上运行的Slurm作业状态,方便用户实时跟踪任务进度。
用户认证管理:
支持和Amazon IAM Identity Center或Microsoft Entra ID的集成,实现用户认证管理。
点击文末阅读原文,立即安装Amazon ParallelCluster UI,简化HPC集群构建、认证和运维管理。
客户案例
业务需求
某头部制药公司是一家立足于科学、具备全产业价值链运营能力,集研发、生产、销售为一体的全球性生物科技公司。该公司在扩展研发管线的同时,借助HPC平台,从而进一步提升研发效率,缩短研发周期。
解决方案
借助Amazon ParallelCluster管理解决方案,统一部署管理和调度传统数据分析和生成式AI创新应用所需的计算、存储、网络等资源。并且,基于该方案,可以根据业务的不同,选择最佳的服务器类型及规格,弹性启动海量CPU或GPU资源,满足包括小分子药物优化、抗体人源化、单细胞分析等业务场景的计算和AI建模需求。
业务成果
新增管线CADD集群部署时间相较原来缩短了70%,显著提升了部署和运维效率。借助云端丰富的资源和集群的自动弹性扩展能力,作业提交后排队时间从原有的数十小时缩短至5分钟以内,并且如单细胞测序、分子对接等场景的作业效率也提升了数十倍,极大提高了业务计算的效率。
期待你的分享 收藏 在看 点赞!
亚马逊的一小步,云计算的一大步!
点击阅读原文,
立即安装Amazon ParallelCluster UI!