港科大 iSING Lab 提出一种针对安全机器学习的 RDMA 加速方案被 USENIX Security’24 接收

文摘   科技   2023-08-19 12:42   中国香港  


 


关于 USENIX Security



USENIX Security Symposium是计算机安全领域最高水平的学术会议之一,USENIX Security’24会议将于2024年8月14日至16日在美国费城召开。本次会议中,香港科大智能网络与系统实验室iSING Lab的一篇论文被录用,题目为:Accelerating Secure Collaborative Machine Learning with Protocol-Aware RDMA, 作者:Zhenghang Ren, Mingxuan Fan, Zilong Wang, Junxue Zhang, Chaoliang Zeng, Zhicong Huang, Cheng Hong, Kai Chen



论文简介



在多方协作的安全机器学习(Secure Collaborative Machine Learning, SCML)中,各参与方数据按照安全多方计算协议(Secure Multi-Party Computation, MPC) 执行机器学习任务。MPC协议带来了大量的通信开销,严重制约了SCML的效率。在实际应用场景中,数据中心高速RDMA网络技术可以极大地提升参与方之间的通信性能,各SCML的参与方可将自己的训练数据加密上传到数据中心里,使用RDMA网络进行高效且安全的模型训练。

然而,RDMA网络与传统TCP网络有不同的通信接口:在TCP网络中,发送方只需要接收方的地址和端口即可发送数据;RDMA网络则需要指定接收方用于存储数据的内存地址。现有方案为了支持网络协议的兼容性和MPC协议的多样性,引入大量额外的数据拷贝、切分、拼接等操作,难以充分发挥RDMA的优势。

为此,港科大iSING Lab提出了一种针对SCML任务的简单、高效、可扩展的RDMA通信方案CORA (Collaboration Over RdmA)。CORA的设计基于以下两点观察:1. 为了保证安全性,SCML任务的通信特征(例如数据长度和接收地址等)通常不会受到输入数据数值改变的影响;2. 数据并行机器学习任务的通信特征高度可预测。因此,我们设计了一种让RDMA感知SCML任务的数据结构,将应用层任务的通信特征编码到该数据结构中。如下图,CORA将不同安全协议的RDMA写入地址分别编码,使用RDMA通信时,将编码转换为实际的远端地址并执行RDMA写入操作。由此,CORA得以剔除低效的兼容层,充分发挥RDMA的性能。另外,CORA提供了充足的扩展空间,可以方便地为新协议提供支持。

实验表明,CORA的这一设计可以充分发挥出RDMA网络的性能优势,相比已有的基于TCP网络的实现,CORA可将SCML任务的效率提升1.2至4.2倍;从通信开销上看,CORA带来了多达11倍的通信效率提升。

近年来,港科大iSING Lab一直关注如何将高速网络硬件与分布式机器学习系统相结合,通过挖掘上层应用的特征,充分发挥底层硬件的性能,加速人工智能应用的整体性能。CORA是首个专门为SCML设计的RDMA加速方案,也是iSING Lab继Sphinx (IEEE S&P 2022)、FedSVD (ACM SIGKDD 2022) 和Flash (USENIX NSDI 2023)之后,在隐私和安全方向发表的又一篇主要论文,实验室将继续探索如何更好地构建安全,高效且隐私保护的人工智能系统。



iSING Lab
香港科技大学网络与系统实验室(iSING Lab)专注于数据中心网络和机器学习系统的研究和创新。