导读
建造职业健康安全(COHS)精准监测是项目成功的先决条件。基于工作包的分布式监测在此方面具有很大的潜力。然而,在较大尺寸(中心化)工作包具有更好的监测表现和较小尺寸工作包(去中心化)具有更强的数据隐私之间存在理论困境。
因此,我们提出了一种去中心化自适应工作包(DAWP)学习模型和区块链架构,保障个性化监测效率的同时兼顾隐私保护。
首先,DAWP学习模型被设计成自适应拓扑结构,将工作包的模型参数与其邻近工作包连接并共享。DAWP学习可以通过混合权重和相似性来计算图形的同-异质性,以提高个性化水平。然后,研究可以将DAWP学习模型拓展到去中心化协作的区块链。最后,通过多个监测任务的对照实验评估区块链-DAWP(BC-DAWP)的效果。
结果表明,采用轻量级模型的BC-DAWP在个性化和保护隐私方面优于所提出的基线方法,为下一代去中心化COHS监测方法和实践提供了借鉴。
文献综述
1
COHS监测中的工作包
工作包是工作分解结构(WBS)级别最低且最适合实际规划、调度和监测的级别。目前主流的用于COHS监测的工作包通常假设工作包可以通过使用每个工作包本地的数据集来联合训练人工智能模型。
然而,先前的研究只将工作包视为一组静态任务,而不是个性化的COHS监测智能体。为此,本文将工作包视为一个基于语义图的COHS监测智能体,包括与建筑工人相关的COHS监测任务和资源(如可穿戴传感器、深度学习模型和数据集)。与此同时,基于工作包的COHS监测的主要目标是在保护工人数据隐私的基础上,使用来自分布式工作包的COHS数据来进行个性化的个人状态的预测。
2
智能COHS监测方法
典型的智能COHS监测方法可以分为三类,即中心化、分布式和去中心化。
第一类中心化是将数据聚集到一个中心。但这会暴露数据的隐私风险,数据存储和通信成本高,个性化能力不足。
第二类分布式是在边缘进行数据处理。由于其高响应速度和一定的个性化,基于边缘计算的解决方案也越来越多。为了进一步提高隐私保护和本地数据不足,联邦学习是一种分布式学习范式,通过共享不同方的加密模型参数而不是原始数据来构建保护隐私的AI模型。然而,分布式也存在一些问题,如仍然采用中心化的参数聚合器、存在单点故障以及本地和全局模型之间的高通信成本。
第三类是去中心化学习。现有的去中心化学习方法对于多个COHS监测任务的异构数据敏感,可能会丧失个性化能力。
基于工作包的COHS监测具有进行去中心化学习的潜力。然而,同时使用异构数据(如非独立同分布(non-IID)数据、可能带有噪声或仅带有子集标签的数据执行多任务(如位置跟踪、疲劳检测、运动分析)可能会显著影响个性化能力(即个体工作包模型的准确性),特别是同时监测各种建筑工地上的大量工人的情况下。此外,隐私保护也非常重要。
3
去中心化学习中的个性化能力
去中心化学习中的个性化目标是使模型在大多数工作包上表现良好(例如高准确性)。然而,在异构数据上的收敛不良和单一共享模型的不足仍然影响着去中心化学习设置中的个性化能力。
为了解决在异构数据上训练模型的性能问题,现有研究开发了基于数据和基于模型的个性化方法,分别旨在减少工作包数据集之间的统计异质性并增强每个工作包内的模型适应性。表1提供了基于数据和基于模型方法的优缺点。大多数基于数据的方法需要构建代表整体数据分布的代理数据集。然而,这样做允许访问整个数据集以了解它们的分布,违反了去中心化学习的COHS监测的隐私保护意图。在基于模型的方法中,例如元学习方法(例如模型无关元学习),相较于正则化和迁移学习,展现出对新的监测任务和新的异构数据的快速适应性。然而,这些基于模型的方法通常假定所有工作包共享一个通用的模型架构,并要求高通信效率。这对基于边缘计算的COHS监测不适用,因为它们受通信资源限制。
为了解决单个模型不足的挑战,现有研究主要集中在开发基于体系结构和基于相似性的方法。前者可以提供针对每个工作包量身定制的个性化模型架构,而后者可以使用工作包之间的关系为高度相关的工作包构建相似的模型。表2总结了这两类方法的优缺点。由于COHS监测涉及每个工作包中的各种任务(例如位置跟踪、运动识别、疲劳检测),因此收集代表性代理数据集并设计最佳的隐私保护策略(例如确定个性化层和个性化特征表示)将会很困难。同时,在每个工作包中使用单个模型学习所有监测任务较为困难,因为建筑工地将涉及关于建筑工人的COHS问题的大量监测任务(例如可能需要高效的通信和计算)。
表1 面向异构数据的个性化方法
表2 面向单一模型的个性化方法
4
小结
在以往关于个性化和隐私保护的COHS监测方法的研究中发现以下两点不足:
① 缺乏一种自适应的方法来处理不同模型的异构数据,以提高每个工作包中多个COHS监测任务的模型性能(即个性化)。虽然元学习展现出了很好的泛化能力和对新异构任务的快速适应能力,但共享模型或参数会导致通信效率低下,因为基于边缘计算的COHS监测在资源上是受限的。
② 缺乏一种方法将个性化学习模型扩展到联盟区块链网络中,以隐私保护和安全的方式在工作包之间共享模型参数。工作包网络中仍存在隐私风险,因为它们涉及许多交互和模型参数交换,特别是对于多个COHS监测任务。因此,需要具有动态参数选择机制的鲁棒的工作包链。
方法框架
图1 BC-DAWP网络结构和配置
本文提出了一种去中心化的自适应工作包(DAWP)学习方法,作为个性化和隐私保护的COHS监测的新范式。DAWP学习方法是一种基于元学习的自适应参数化方法,其计算创新在于自适应优化去中心化学习中的混合权重,旨在增强本地模型(即个性化)在非独立同分布的任务或数据上的性能。DAWP学习的核心是训练和微调少量在不同工作包之间共享的参数,这些工作包代表了不同的COHS监测任务。通过这个过程,DAWP学习有效地识别了这些工作包之间的复杂关系,并巧妙地将最相关的工作包组合到每个本地工作包中。
此外,本文开发了联盟区块链网络(BC-DAWP),以实现在工作包之间共享模型参数,这是隐私保护和安全的去中心化COHS监测的技术创新。在这个网络中,模型训练发生在边缘,可以直接处理即时的边缘数据,实现及时的数据驱动决策。在这个去中心化的架构中,只有学到的深度表征才会在协作工作包之间交换,而不是原始数据。BC-DAWP由各种被定义为节点的组件组成,包括DAWP学习(DL)节点、DAWP网络(DN)节点、DAWP命令接口(DCI)节点、模型训练(ML)节点和DAWP操作(DO)节点。BC-DAWP内的每个节点都是模块化的,并在单独的容器内运行。这些节点代表不同的BC-DAWP功能,而不是代表物理服务器节点。
DL节点是BC-DAWP的核心。与网络内所有其他DL节点协同工作,它们不断交换学习成果并整合来自其他节点的深度表征,具体涉及模型参数。DL节点作为COHS监控深度学习模型和其他BC-DAWP组件之间的接口,负责安全分发和合并模型参数。
DN节点构成区块链网络,利用以太坊开源版本作为底层联盟区块链平台。这些节点通过网络相互交互,维护和跟踪进展,利用这些状态和进展信息协调其他BC-DAWP组件的操作。特定的DN节点Sentinel Node负责初始化区块链网络,作为第一个启动的节点。需要注意的是,只有元数据(即共享参数)被写入区块链,而模型本身并不存储在其中。
DCI节点通过使用上下文和智能合约作为监测、控制和管理BC-DAWP的命令接口工具。DCI上下文是一个字符串标识符,它标识一个DCI命令环境,并具有用于执行DCI命令的工件(API服务器IP、端口、环境变量和版本)。DCI智能合约用于控制DAWP学习训练过程,它是以太坊智能合约的一个实例,部署到区块链并注册到BC-DAWP中。
DO节点作为代理负责管理BC-DAWP操作。它监督任务的执行,如启动和停止BC-DAWP运行,构建和更新ML节点,以及分发模型参数用于训练。这些任务以以太坊平台内的智能合约形式分配给DO节点。
许可证服务器(Licence Server)通过实现X.509证书解决了BC-DAWP内的安全和数字身份方面的问题。此外,许可证服务器负责安装和管理BC-DAWP许可证,由在单独节点上运行的AutoPass许可证服务器(APLS)监督。
ML节点负责训练和迭代更新模型。每个ML节点与BC-DAWP内对应的DL节点配合进行训练过程。这些ML和DL节点对必须在同一工作包上运行。这种协作努力将持续到DL节点成功训练出令人满意的模型为止。值得注意的是,ML节点可以容纳任何参数化的有监督学习模型,无论是完全可训练的还是部分可训练的。
实验验证
通过实验,展示了DAWP学习与联邦学习和分布式学习方法相比的各种实际优点。由表3可见,使用轻量级模型(即MobileViT-XS或MobileViT-S)的DAWP学习的准确性性能相对于现有联邦学习(即Fedavg)、去中心化学习(即CGA)更好,并且大大优于本地模型。
与此同时,通过训练时间和收敛轮次的情况,DAWP学习的计算效率相对于联邦学习(即Fedavg)、中心化学习(即CGA)也有优势。
表3 DAWP及基准方法的效果和效率的比较
图2 DAWP及基准方法的训练损失和准确率比较
上述实验结果是基于CMA数据集生成的CMA-mini数据集。CMA-mini主要关注建筑工地上的三个典型COHS监测任务(图3),包括攀爬(标签:0,攀爬梯子,COHS监测中一种典型的危险任务),佩戴头盔(标签:1,监测个人防护装备的不当使用)和吸烟(标签:2,一种常见的个人行为,可能会分散和降低COHS意识,也可能导致火灾事故)。
为了进一步了解DAWP学习在每个节点上的性能差异,图4展示了三个不同COHS监测任务上DAWP学习的性能。有趣的是,Node 3在“攀爬”任务表现最差。“攀爬”占总数据集的约31.6%。这可能是Node 3在所有节点中表现不佳的原因之一。虽然“佩戴头盔”是三监测个任务中表现最差的,它只占总数据集的20.6%,似乎对每个节点的性能没有显著影响。
图3 COHS监测任务样本示例
图4 COHS监测任务结果
总结
我们通过多个监测任务的对照实验评估了区块链-DAWP(BC-DAWP)的效果。结果表明,采用轻量级模型的BC-DAWP在个性化和保护隐私方面优于所提出的基线方法,为下一代去中心化COHS监测提供了借鉴。
尽管本文取得了上述的突破,未来研究中还有若干问题需要解决。首先,考虑建立一个大规模的多模态COHS监测数据集,以进一步提高DAWP学习的个性化的稳定性的性能;其次,我们将进一步开发计算基础设施,以测试DAWP学习在>100个工作包(计算节点)的可扩展性和弹性;第三,我们将采用差分隐私算法和高级加密技术,并将其定制到基于区块链的DAWP学习网络中。
参考文献
Li, X., Zeng, J.,Chen, C.,Li,T, Ma, J. (2024). Decentralized adaptive work package learning for personalized and privacy-preserving occupational health and safety monitoring in construction. Automation in Construction,165 (2024) 105556.
https://doi.org/10.1016/j.autcon.2024.105556
关注我们
团队长期招聘博士后研究员、博士研究生、科研助理(软/硬件工程师)和科研实习生(可远程),详情可参考https://cicubelab.civil.hku.hk/joinus 项目合作请发送邮件至shell.x.li@hku.hk
END
编辑 | 曾健欢
排版 | 董 晴
审核 | 李 骁