杨强:“人工智能 +”的国际探索及中国经验

学术   财经   2024-12-12 11:32   北京  

近年来人工智能已走到了科技前沿的风口浪尖,正在深刻影响全球各行业的发展。“人工智能+”涉及数据管理、算法优化、系统设计和成本控制等多方面的综合挑战,需要持续的技术创新和策略调整,以推动AI技术更加成熟、高效地服务于社会各个领域。伴随AI技术的不断发展和应用,未来人工智能将有望在更多行业发挥更广泛的作用,推动全球经济的发展和创新。


金融行业高度数字化和商业化应用场景的高潜在价值,使其成为应用AI技术的最佳场景之一。2023年,中央金融工作会议提出要做好数字金融大文章。中央经济工作会议强调,要推动高水平科技自立自强,以科技创新推动产业创新。以上政策部署也为我国金融行业的数字化转型和发展指明了新方向。而在金融行业数字化发展的过程中,人工智能将有望进一步激发创新发展的新动能。



 

香港科技大学荣休教授、

加拿大皇家科学院院士、

加拿大工程院院士、

微众银行首席人工智能官  杨强




“人工智能+”的国际探索

伴随人工智能的高速发展,“人工智能+”正成为各行业不断探索新场景、新赛道的动力之一。国内外都在对如何发挥其潜力并应用于不同行业场景,持续展开深入探索。


其中,联邦学习作为更准确且通用的人工智能模型方法,正被应用于多种真实场景中,并通过全球范围的联动合作,构建更稳健且更具普适性的机器学习和人工智能模型。


什么是联邦学习呢?举例来说,假设有两个不同的企业A和B,他们拥有不同的数据,企业A有用户特征数据,企业B有产品特征数据和标注数据。按照GDPR准则,两家企业不能粗暴地把双方数据直接合并。假设双方各自建立一个任务模型,每个任务可以是分类或预测,且这些任务已在获得数据时有各自用户的认可。但如何在A和B各端建立高质量的模型呢?数据不完整(例如企业A缺少标签数据,企业B缺少特征数据)或数据不充分(数据量不足以建立好的模型),可能导致各端的模型无法建立或效果不理想。而联邦学习正是要解决这个问题——做到各企业的自有数据不出本地,而联邦系统可以通过加密机制下的参数交换方式,即在不违反数据隐私法规的情况下,建立一个虚拟的共有模型,数据本身不移动,也不泄露隐私、不影响数据合规。建好的模型在各自区域仅为本地的目标服务。


为了进一步准确阐述联邦学习的思想,我们将其定义如下:在机器学习过程中,各参与方可借助其他方数据进行联合建模。各方无需共享数据资源,即数据不出本地的情况下,进行数据联合训练,建立共享的机器学习模型。


基于此,科技公司英伟达发起了开源形态软件开发套件(SDK)NVIDIA FLARE(Federated Learning Application Runtime Environment,NVIDIA联合学习应用运行时环境),一种与领域无关、开源且可扩展的联邦学习SDK。该SDK是一个轻量级、灵活、可扩展的Python软件包,可允许研究人员将他们的数据科学工作流应用于任何训练库(PyTorch、TensorFlow、XGBoost甚至NumPy)中实现,并将其应用于真实场景下的联邦学习设置中。它使研究人员和数据科学家能够将现有的ML/DL工作流程调整为联合模式,并使平台开发者能够为分布式多方协作构建安全、保护隐私的产品,并应用于医疗健康行业场景。


英伟达发布的报告《NVIDIA FLARE:从模拟到实际场景的联邦学习(NVIDIA FLARE:Federated Learning from Simulation to Real-World)》指出,FLARE及其前代产品已被用于多项实际研究,以探索联邦学习在医疗健康场景中的应用。


跨国机构之间的合作测试验证了联邦学习的实用性,推动了稳健、可推广的人工智能模型的训练。这些举措包括将联邦学习应用于乳房X射线摄影分类、前列腺分割、胰腺分割,以及最近的胸部X射线(CXR)和电子健康记录(EHR)分析,以预测因COVID-19症状而到急诊科就诊患者的氧气需求。不仅于此,来自其他行业的企业及研究人员亦可将FLARE应用于跨孤岛(Cross-silo)联邦学习,进一步通过“人工智能+”推动行业创新创造,激发行业潜能。


“人工智能+”在国外应用的另一个实例来自金融行业。数字经济时代,金融行业也在不断更新迭代,衍生出新的行业实践。而人工智能在金融领域的实践,也推动着数字金融的蓬勃发展。


随着数字银行的出现,金融与科技的融合为金融行业、机构及客户带来了变革性的体验。GoogleCloud利用人工智能在自动化、准确率、效率、速度、可用性及创新性等方面的优势,发挥了服务和产品个性化、商机开拓、风险和欺诈管理、合规透明度和运营自动化并降低成本等作用。而Monzo作为一家金融机构,基于Google Cloud和Google BigQuery易使用、零维护且强大的BI分析功能,改进并优化其快速迭代的产品与服务。


由Google BigQuery支持的客户服务功能,为客户在客服聊天室中提供了常见问题及相关流程的解决方法等信息,客户在向客服代表发起服务请求前,即可通过智能指引解决问题。据测算,10个月内Monzo应用程序中收到的客户服务支持请求减少了50%,反映出Google BigQuery自主性、精细度及自动化带来的有效数据分析,不仅提升了客户服务体验及效率,也使得Monzo数据团队可从处理小问题的工作中解放出来,专注于对公司发展更重要的问题。同时,Monzo计划通过Google Cloud工具包拓展其TensorFlow诈骗预测模型,以进一步优化其优于行业平均水平的反欺诈能力。


人工智能在海外市场不同业态的多样应用,为研究人员、商业机构及普罗大众带来了前所未有的研究方向和使用体验。




“人工智能+”在金融行业的“中国经验”

国际上多行业共同探索“人工智能+”落地应用,展示出其强大的潜力。而在国内,金融作为人工智能探索最为积极、成果也最为显著的行业之一,其“人工智能+”的成效也受到广泛关注。


人工智能通过更高效精确的数据洞察,可以帮助金融机构更好地了解市场和客户,推动金融服务向更加智能化和个性化发展,促使金融机构更有效地管理风险、降低服务成本、提高运营效率、优化客户体验。


例如,得益于人工智能技术的海量信息处理能力,通过大数据分析和模式识别,能够更为准确地预测和评估风险。金融机构可以利用AI进行信贷评估、欺诈监测、市场风险分析等,从而提高风险管理的效率和准确性。同时,AI也帮助金融机构更好地遵守监管要求,通过自动化合规检查并减少违规事件。


再如,在客户体验方面,AI技术的应用使得金融服务更加个性化和便捷。例如,通过聊天机器人和虚拟助手,金融机构能够提供7×24小时的客户支持,同时收集用户反馈和行为数据,以优化服务和产品。


而因金融机构的数据隐私性,以及大模型需在本地的限制条件,要求大模型需适用于特殊的本地数据并自动适配机器学习能力。这是目前已有大模型不具备的能力,也是金融行业需要攻克的下一个技术关口。


国内近年来已有多家金融机构开始尝试将人工智能用于实践。以微众银行为例,将联邦学习与大模型AIAgent(人工智能业务助理)相关技术融入金融服务的前中后台各个环节,提升普惠金融服务的质效。


如图所示,以业界领先的隐私计算联邦学习技术为特色,微众银行构建了能够支撑和服务金融业务的场景化AI Agent应用矩阵。基于大模型技术能力,以自研视觉引擎、语音引擎、自然语言引擎、声纹等技术为底座构建而成,已逐步应用在客服、营销、风控等场景。

图  WeBank AI Agent应用矩阵


在客服场景,应用大模型AI Agent技术对客户对话内容进行小结,准确率达98%,助力座席快速定位用户问题,可每日减少100人天的对话内容处理量。通过模型完成直通理财知识库相似问题推荐,相似问题可用率达91%,相比传统人工整理语料的处理效率提升两倍以上。


在消费者权益保护场景,基于大模型技术打造了消保广告视频审核系统,每月可自动审核广告视频,平均准确率达95%,节约90%的人工审核时间。智能质检系统覆盖多个业务的营销、客服等场景,实现全量质检,平均准确率超90%,有效规范了座席行为。


在营销场景,基于联邦学习与大模型AI Agent技术,在业务数据不出本地的情况下,打造了安全合规的营销闭环。在寻找用户环节,基于联邦学习与大模型技术,业务数据不出本行,联合广告平台、第三方数据源等进行联邦建模,精准找到目标用户。在营销内容生成环节,通过大模型AI Agent技术生成营销素材,可自动完成内容审核及打分,通过媒体平台、电销、公众号等渠道触达目标用户,提升用户转化效率。


在风控场景,坚持依法合规经营,尤其注重数据安全与用户隐私保护,在技术层面,以业界领先的隐私计算联邦学习技术为特色。基于联邦学习技术打造安全合规的联邦中台,服务行内多个业务。


在信贷风控场景,针对中小微企业信贷评审数据稀缺、不全面、历史信息沉淀不足等问题,通过联邦学习,探索在确保数据安全及隐私保护的前提下,融汇企业经营数据、税务数据、工商数据、支付数据等多源信息,丰富建模特征体系,提升风控模型的准确性和有效性。


在反欺诈场景,通过AI人像核查、声纹核查等技术,在开户、授信、放款等金融服务多个环节把控风险,有效甄别欺诈行为。


在知识产权保护与创新驱动场景,重视以专利申请为代表的一系列知识产权保护,而专利申请面临的专利检索、查新、挖掘、撰写、审查等难点,往往影响申请效率,需要智能化的专利系统予以优化。微众银行基于大模型与AI Agent技术打造了智能专利Agent,实现专利的智能检索、智能挖掘、智能撰写、智能审查,有效降低了专利撰写难度,提高了专利申请效率。


此外,聚合海量的科创企业数据,构建垂直领域大模型,并依托大模型的信息处理能力,提高对科创企业的认知颗粒度。在深度分析企业需求的基础上,利用AI能力深度服务科创企业的融资、信贷、保险等方面需求,并实现对科创企业的数字化精准触达和数字化营销运营,提升了科技金融服务质效。




“人工智能+”的未来

随着人工智能技术的不断迭代,一些更深层的改变正在发生,例如在就业方面,人工智能技术的应用将会改变行业的就业结构。一方面,某些传统岗位可能会因为自动化而减少,但另一方面,AI的发展也会创造新的就业机会,如数据科学家、AI工程师等。企业需要对员工进行技能再培训,以适应技术变革带来的新要求。


在人工智能高速发展的同时,不可忽视的是,当我们从科学技术发展的客观规律角度看,若以人的成长过程作比,其仍在幼年时期——人工智能相关应用尚未达到预期的广度和深度,特别是在经济和生产领域,行业对现有人工智能原理的理解仍处探索阶段。这也导致了目前大模型的可解释性和透明度不足,进而使得我们在一些需要高度确定性的领域,如金融精算和医疗领域不敢轻易使用大模型。


此外,以我个人观点来看,人工智能不仅仅是计算机技术的一个分支,它更是一门经济学,需要考虑投入与产出比。例如,我们目前面临人工智能落地投入产出比相对较高、算力成本高昂、数据获取困难及人才成本昂贵等问题,这本质上都是经济学的问题。


为解决这些问题,我们需要从两个方面着手:一是对大模型进行系统的科学研究,二是继续探索大模型在哪些领域可以发挥作用。这种研究和探索并非易事,需要科学家、研究机构、开发者等组建成熟的研发群体,展开系统性的深入研究。


当我们对于人工智能的科学本质有了全面的了解,通过开放透明的协同合作,推动人工智能的行业应用实现了更多的商业可用性,“人工智能+”也将更可靠、可持续。


(此文刊发于《金融电子化》2024年11月上半月刊)

推荐阅读(点击图片查看精彩内容)










新媒体中心

主任 / 邝源

编辑 / 姚亮宇  傅甜甜  张珺  邰思琪

金融电子化
面向金融界科技人员、业务人员,在金融信息化建设中,为领导决策提供参考,为科技人员和业务人员提供交流的园地以及了解科技应用的窗口,为读者提供金融信息化发展最前沿的各类知识和信息。
 最新文章