☝设置星标★ 抢“鲜”浏览精彩内容
作者 | 吴永飞 王彦博 魏文术 刘曦子
当前数字经济快速发展,数据生产要素的价值日益凸显。金融行业是数据密集型和科技驱动型行业,商业银行数字化转型过程中对数据要素价值需求持续增长。聚焦商业银行业务实际,存在数据壁垒难以打破、数据价值流通不畅、金融服务智能化受限、数据利用安全风险发生等问题。区块链技术支持多方数据协作和数据存证,而隐私计算技术支持多方数据协同计算,两者提供了解决数据安全与隐私问题的新手段,可以在不泄露原始数据的前提下,开展多方数据安全共享,释放多方数据价值,实现数据“可用不可见,可控可计量”。针对数据共享难等痛点,融合运用区块链和隐私计算技术,探索多方数据安全跨域合作,提升数据价值利用效率,对更好地推动商业银行数字化转型工作具有积极的现实意义。
区块链技术应用发展
2019年10月24日,习近平总书记在十九届中央政治局第十八次集体学习时指出,区块链技术的集成应用在新的技术革新和产业变革中起着重要作用。区块链技术应用已延伸至数字金融、物联网、智能制造、供应链管理、数字藏品等多个领域,我国要积极推进区块链和经济社会融合发展。2020年以来,国家和地方政府高度重视区块链技术与产业发展,积极出台相关鼓励政策。国家发展改革委明确将区块链纳入新基建范畴。工信部、中央网信办联合发布的《关于加快推动区块链技术应用和产业发展的指导意见》指出,到2025年,区块链产业综合实力达到世界先进水平,产业初具规模。地方政府层面,截至2023年12月,全国已有29个省市将发展区块链技术产业纳入地方“十四五”规划。
区块链是一种由多方共同维护、分布式储存的记账技术,具有数据难以篡改、信息抗抵赖、多中心、分布式记账等特点,可重构信用形成机制,深刻影响金融交易过程,推动金融基础设施变革和商业价值低成本转移。区块链在银行应用场景可分为三类:一是对数据存证防伪、数据确权及数据全生命周期管理有较大需求的场景。例如,电子保函、数字保理、数字藏品等业务相关电子资料存证溯源,以及产业数字资产可信采集、有效识别、确权认证、使用流通的全流程全生命周期管理。二是多主体间对提升协作效率、降低信任成本有较大需求的场景。区块链作为多方协作系统,通过数据防伪保真建立数字信任,并通过可信流程协作提升各方协作效率。例如,贸易金融、供应链金融等场景需要多个参与方实现互信和业务高效协作。三是对数据安全共享和数据联合计算有较大需求的场景。区块链作为分布式数据库,能够实现在一定程度上保障隐私数据安全前提下的数据共享。例如,反欺诈黑名单共享、联合征信等。
关于区块链技术本质及应用发展,有三个要点值得关注。首先,密码学是区块链技术的基石——密码学在区块链技术中的主要用途在于保护链上数据信息的机密性、完整性、认证性和不可抵赖性,并由此构建基于数据的信任机制。第二,跨链技术是区块链能在更大范围内开展数据要素和数据价值融通、共享和交换的桥梁——跨链主要解决链上与链下、链与链之间的数据等要素的互操作问题,通过跨链技术,实现区块链网络中的资产、数据和业务的互操作,有助于构建互联互通的产业生态,推动数据要素和数据价值在全球范围内流通。第三,区块链作为数据底座技术之一,能有力支撑数据中台发展——区块链汇聚了业务流程中的信息流、商流、物流、资金流等数据,且有效保障了数据的可控共享、不可篡改,为授信、风控等业务场景提供了相对安全可信的基础分析数据,能解决信息割裂和不可信等痛点,支持大数据金融创新业务发展。
隐私计算技术应用发展
隐私计算技术是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系,其核心作用是让两个或多个参与方在不泄露各自数据的前提下,实现加密状态或非透明状态下的数据协同计算,为隐私信息提供全生命周期保护,实现数据价值挖掘和共享。从底层技术路径视角出发,隐私计算分为三个主流发展方向:多方安全计算(Multi-Party Computing,MPC)、联邦学习(Federated Learning,FL)和可信执行环境(Trusted Execution Environment,TEE)。多方安全计算主要研究在无可信第三方的情况下,安全地进行多方协同计算问题。该技术应用了密码学的一些重要隐私技术成果,包括同态加密、秘密共享、不经意传输、混淆电路、零知识证明等。联邦学习是一个多方协同的机器学习框架,可满足多个参与方在保护数据安全和隐私信息的前提下进行数据计算和模型训练。对于不同应用场景的数据集特点,联邦学习又分为纵向联邦学习、横向联邦学习和联邦迁移学习三类。可信执行环境是数据计算平台上由软硬件方法构建的一个安全区域,通过将模型及模型需要的数据汇集到可信安全区域中,实现互不信任的多个参与方进行数据协同计算,输出计算结果,同时保证在安全区域内代码和数据的机密性和完整性。
在银行产业数字金融领域,产业价值链纵横交织,产业数据多源异构、海量高频,存在数据要素安全共享融合难、数据价值挖掘难等问题。隐私计算技术在保护隐私数据安全的前提下,实现产业多方数据协同计算,可在风险控制、联合营销等场景中发挥重要作用。基于隐私求交、隐私查询、联合建模等隐私计算技术手段,在数据不出域的前提下,可实现产业生态不同主体多维度数据融合,横向联通电信运营商数据、交通出行数据、消费数据、征信数据等,并将多维度的数据纳入反欺诈模型、联合风控模型、精准营销模型中,以此开展多方协同计算,释放多方数据价值。
隐私计算技术本质及应用发展有三个要点值得关注。首先,密码学是隐私计算技术的核心——隐私计算大量应用了当今密码学在数据隐私保护领域的经典研究成果,在密文计算、联合计算、数据隐私保护等方面具有独特优势。第二,隐私计算支持多方协同计算,有利于数据信息价值共享——隐私计算技术提供了打破数据孤岛,解决数据安全与隐私问题的新技术手段,可在不泄露原始数据的前提下,开展多方数据安全共享,释放多方数据价值,实现数据“可用不可见”。第三,隐私计算可与区块链、大数据等技术融合应用,更好地支持隐私数据保护——随着欧盟《通用数据保护法案》(GDPR)的出台和《中华人民共和国个人信息保护法》的施行,隐私立法时代正在开启,隐私计算、密码学、区块链、大数据等技术快速迭代,日益成熟,融合运用隐私计算与区块链、大数据等技术来实现隐私数据保护和安全共享恰逢其时。
区块链与隐私计算相互赋能、融合创新
区块链与隐私计算可实现优势互补
区块链技术大量应用了密码学技术,实现数据可溯源、不可篡改和可审计,在推动数据要素共享和数据价值流动方面具有先天优势,但仍存在链上链下数据隐私保护手段不足、链上链下计算处理能力不足等问题。隐私计算技术博采密码学之长,大量应用了当今密码学在数据隐私保护领域的经典研究成果,形成多方安全计算、联邦学习等技术体系,在密文计算、联合计算、数据隐私保护等方面具有独特优势,可有效弥补区块链在数据隐私保护能力上的不足。但与此同时,隐私计算亦存在在计算流程、模型参数更新和身份可信等方面缺乏有效监督验证,以及协作平台环境缺乏、激励机制不完善等问题。区块链与隐私计算融合应用,可在如下方面实现互补:一是在身份认证方面,利用区块链和分布式数字身份实现数字身份管理,确保参与方真实可信;二是在数据全生命周期保护方面,区块链对隐私计算过程中的数据申请、授权、计算结果全过程上链记录和存储,可保障隐私计算过程数据全生命周期的安全性,满足全程可追溯、防作弊,以及监管审计要求;三是在高效协作方面,可引入数据质量评价体系和激励机制,提升参与计算的数据质量,推动数据安全共享计算;四是在协同计算能力方面,隐私计算融合了密码学重要隐私技术成果,包括同态加密、秘密共享、不经意传输、混淆电路、零知识证明等多方安全计算技术和联邦学习技术,极大地拓展了区块链在链上链下的隐私保护能力。
区块链与隐私计算技术融合创新的三种模式
区块链与隐私计算的技术融合创新包括存证溯源层、智能合约层和技术架构层三种模式。
一是存证溯源层融合。隐私计算涉及的中间计算过程和最终结果等数据信息均通过区块链进行存证溯源,实现隐私计算过程中关键数据信息的全生命周期保护。在这种模式下,参与多方协同计算的各种任务记录、源数据Hash摘要、中间计算过程、结果数据均上链存证,由此保障隐私计算的数据和算法全生命周期可信。
二是智能合约层融合。在区块链系统中实现和部署具有隐私计算功能的智能合约。基于区块链智能合约和隐私计算相关算法,开发具有隐私计算功能的智能合约,实现密钥分发、同态加密、秘密共享、隐私查询、联合统计等功能,完成区块链与隐私计算技术融合应用。
三是技术架构层融合。构建统一和深度融合的“区块链+隐私计算”开放架构。通过对区块链底层部分功能模块重构和开发,在区块链上层协议实现分布式模型聚合任务,构建支持隐私计算功能的新型区块链底层平台架构,实现区块链和隐私计算在协议层面的深度融合。
区块链与隐私计算技术融合的
银行应用解决方案
在银行业务发展过程中,为解决数据可用、数据可信等问题,需要将区块链与隐私计算技术融合,形成联合黑名单共享查询、联合统计分析、反欺诈标签补全、联合风控建模等创新数字化技术解决方案。
联合黑名单共享查询
银行、小贷公司等金融机构均维护逾期、失信、欺诈等行为的客户黑名单信息,但各机构的信息并不互通,黑名单信息难以共享。金融机构若能够在不泄露用户隐私的前提下,共享黑名单信息,则可以大大降低各机构尽调成本,完善用户信息特征库,提升金融应用效率和效果。
在传统数据查询服务模式中,查询方向数据源方发送明文或加密的身份要素发起查询,数据源方直接返回数据标签,这种查询方式,存在数据源方将查询方客户身份要素等隐私信息泄露的风险隐患。隐私信息检索技术则可以在不泄露用户信息的前提下完成黑名单共享查询。例如,机构A向机构B查询用户张三是否有逾期或者违约行为,该过程中不泄露用户信息,机构B不知道机构A的具体查询信息,机构A也不知道除该张三用户以外的其他用户信息。
基于区块链与隐私信息检索技术,在各参与方之间组成联盟链,查询方采用隐私信息检索查询方式向联盟发起查询申请,对各参与方数据上传、查询等操作都记录在链上存证,并设计数据质量评价体系,推动各方积极参与数据共享。在银行业务场景下,具体业务流程为:用户在机构A申请贷款,机构A验证用户身份并受理;联盟链验证机构A身份,验证通过后机构A发起黑名单隐私查询;通过智能合约和消息中间件,进行任务和密钥分发,并通过不经意传输协议实现加密数据交互等;机构A获得其他机构返回加密数据,并使用私钥解密,获得黑名单查询结果;最后,系统积分结算,激励任务参与者。
联合统计分析
产业生态中,多头借贷行为利用各金融机构之间“数据不互通、信息不对称”实施欺诈。在多头借贷等场景中,单个机构掌握的数据不足以有效规避欺诈风险,亟待打通机构间的数据孤岛,探索开展联合征信工作。对于各金融机构而言,用户在该机构办理借贷等服务的信贷数据属于商业秘密,需要一种安全可信且保护隐私的方法实现数据信息共享。
基于区块链、同态加密、秘密共享等技术,构建多方协同计算平台,可在各方不披露具体贷款信息等业务数据的前提下,计算出具体借款人的跨金融机构授信、用信总金额等信息,实现联合征信查询。在银行业务场景下,具体业务流程为:客户向机构A发起借贷申请,机构A经过身份认证后通过协同计算平台发起该客户的联合征信查询任务;各机构计算节点接收申请,并确认有效后,参与联合征信计算任务;隐私计算智能合约对各机构提交的加密或混淆数据进行联合计算,得到统计结果;金融机构A通过智能合约查询加密结果并解密,得到客户的各机构授信、用信总额等信息,完成联合征信查询流程。整个过程中,任务发起、身份验证、同态加密计算等操作均上链存证,实现操作记录数据可追溯和可审计。此外,核心业务流程实现密文传输、密文计算、密文存储,保证数据安全。
反欺诈标签补全
银行业务领域反欺诈识别工作往往需要电信运营商、电商等外部机构的标签数据,以获得更高的反欺诈识别率。客户标签作为重要隐私数据不能直接跨域共享。基于隐私求交技术,数据持有方之间可在保护数据隐私的前提下对客户数据集求交集,完成重叠客户标签补全。由此,金融机构从其他机构获得自有客户更多涉及欺诈行为的标签数据,以完善客户画像。
在反欺诈标签补全场景中,基于区块链和隐私求交技术,可实现持有各自数据集合的两方执行双方集合的交集运算,并在不泄露用户隐私前提下得到交集结果。在银行业务场景下,具体业务流程为:机构A发起联合标签补全查询任务;机构B配置标签补全联合查询任务,并同意开启反欺诈标签补全任务;双方共同启动隐私计算任务,任务完成后,反馈隐私查询计算结果。在整个过程中,任务查询、计算数据、授权行为记录等数据操作均存证于区块链,便于追溯和监管审计。
联合风控建模
风控模型是金融机构风险管理的核心,风控模型的构建需要利用客户多维数据实现。一般而言,数据样本越多,特征维度越丰富,风控模型效果就越好。银行本地拥有的客户特征维度往往有限,难以满足精准建模需求。特别是银行对公业务领域,针对样本量少、样本不平衡等问题,可与外部机构开展数据合作,基于区块链和同态加密、秘密共享、差分隐私、联邦学习等隐私计算技术,在不泄露数据信息的前提下完成联合建模,构建更精准高效的风控模型。
联邦学习是在各参与方无需共享数据资源,即数据不出本地的情况下,进行数据建模联合训练,建立共享的机器学习模型。根据参与方数据的特征和样本空间的不同,联邦学习可分为横向联邦学习、纵向联邦学习和联邦迁移学习。横向联邦学习适用于用户特征重叠多、用户样本重叠少的情况;纵向联邦学习适用于用户样本重叠多、用户特征重叠少的情况;联邦迁移学习适用于用户特征和用户样本都重叠少的情况。联邦学习一般包括加密样本对齐、加密模型训练和效果激励三个部分,目前业界主流的联邦学习框架有TensorFlow Federated、Pysyft、FATE、FedML等。
基于区块链与联邦学习技术开展联合风控建模,利用区块链授权机制、身份管理等,建立安全可信合作,可提高联合风控建模可信度。在银行业务场景下,具体业务流程为:联盟链验证各参与方身份,启动联合风控建模任务;模型参数初始化,各参与节点使用各自持有的数据在本地训练模型,模型参数更新;模型训练结果上链,并通过协同计算中间件汇聚各参与节点的训练结果,用于更新模型参数,并开始下一轮迭代训练,直到模型训练结束。在上述过程中,对各参与方进行贡献评估,通过积分发放等方式实行利益分配及激励机制,以鼓励各方积极参与。在整个联合建模流程中,任务发起、重要梯度等中间参数交互(可进一步采用同态加密进行参数保护)、运行结果等数据均进行上链存证,便于后期追溯审计。
结语
银行业务领域,通过区块链与隐私计算技术在身份认证、数据全生命周期保护、高效协作和协同计算等方面优势互补和融合应用,有助于在隐私与数据保护的前提下,开展跨域数据合作,支撑产业多方数据安全融合、协同计算和数据价值挖掘,推动银行业务发展。未来,随着区块链和隐私计算技术持续更新迭代,在架构和协议层面实现区块链与隐私计算的深度融合应用,将有效提高模型存储和更新过程中的安全性、隐私性与效率,推动可信AI发展,最终以各方数据资产的价值最大化实现数字经济时代多方共赢的局面。
(华夏银行信息科技部贾蒴,龙盈智达〔北京〕科技有限公司杨璇、张月、郑宏、李广龙、阳少杰对本文亦有贡献)
作者单位:华夏银行,
龙盈智达(北京)科技有限公司
责任编辑:孙 爽
976639255@qq.com
文章刊发于《银行家》杂志2024年第11期「数字金融」栏目
END
分享、在看与点赞,全都想要拥有!