技术应用 | 大模型在金融领域的应用与安全研究

学术财经 2024-12-05 11:12 北京

文 / 上交所技术有限责任公司陈洪炎胡跟旺卓航星

金融领域拥有天然的大量数据积淀，为大模型在金融领域的应用提供了良好的数据基础，因此金融行业大模型相较于其他行业的垂直大模型中落地速度相对较快。同时金融领域大模型的应用场景较多，大模型有助于从不同角度提升原有从业人员及机构的工作效率。大模型在金融领域的实践需要考虑多方因素，除了大模型技术框架对现有金融业务的效率提升以外，金融业务的专业性、严谨性、安全性及合规性要求对大模型在金融领域的应用实践也提出了更加严格的风险防控措施要求。

大模型的发展与应用

1.大模型架构。大模型最早诞生于自然语言处理领域，最开始自然语言模型通过神经网络预测单词，加入注意力机制后，使单词之间建立关系而考虑整句语言的含义，从而建立Transformer架构。谷歌和微软分别针对Transformer的编码部分以及解码部分进行研究从而产生了两条技术路线，即以BERT为代表的仅用编码器部分的路线和以GPT为代表的仅用解码器部分的路线。BERT与GPT都用到了预训练范式，预训练范式是指利用大量的数据训练一个基础模型，然后在下游任务上进行一点微调就能够在相应的任务上得到很好的性能表现。通过不断叠加数据并增加模型参数规模以及优化模型的提示工程，不仅可以解决更复杂的任务，同时也拥有了更强大的文本涌现能力。仅用编码器架构的大模型擅长对文本内容进行分析、分类，包括情感分析和命名实体识别，如BERT。仅用解码器架构通常用于序列生成任务，如文本生成、机器翻译等需要生成序列的任务，如GPT。为结合编码器和解码器的优点，出现了编解码器架构如T5和GLM。为了解决仅用解码器架构时内存占用高、响应慢等问题，微软提出双解码器Decoder-Decoder新型架构YOCO（You Only Cache Once），两个解码器分为自解码器（Self-Decoder）和交叉解码器（Cross-Decoder）两部分，以此来降低内存开销，提高性能及吞吐率。

2.大模型在金融领域的应用。随着硬件能力发展，算力已满足大模型的计算要求，大模型逐渐进入公众视野，大模型应用迎来了蓬勃发展，并在媒体影视、电商、广告营销、游戏、医疗、教育及金融等各行各业中得到广泛应用。大模型浪潮爆发后，国内各企业纷纷推出自研大模型。金融领域拥有天然的大量数据积淀，从而为大模型应用提供了良好的数据基础，大型科技企业如华为推出了盘古金融大模型，蚂蚁集团发布了金融大模型AntFinGLM。

金融行业的专业性、严谨性、合规性等特点，在把大模型技术应用到金融领域面临挑战，如：通用大模型的缺乏金融专业知识，通用大模型缺乏金融情境下上下文理解能力，通用大模型无法满足金融合规及监管等要求。金融机构在应用大模型到金融业务场景的过程中，一般需要经过两个主要步骤：一是从通用大模型进一步训练调优出专业的大模型；二是以大模型为核心，结合金融专业知识库、金融专业工具库、智能体、安全合规组件等构成一个可满足金融领域安全应用要求的应用系统，来支撑在金融大模型各场景中的应用。

3.金融大模型的开发框架。通用大模型在金融领域的适配一般需要经历数据收集、数据处理、在金融语义语境中训练通用大模型、参数微调、提高复杂推理能力、优化性能、减少幻觉、模型部署、模型评测、模型应用等流程。金融大模型开发框架（见图1）大致分为5个层次，即数据层、训练层、部署层、推理层和应用层。

图1 金融大模型开发框架

（1）金融数据收集。金融数据收集包括预训练数据、金融指令和安全数据。预训练数据主要包括广泛金融背景知识、语义语境认知等金融语料。预训练数据来源广泛，数据格式多样化，一般需要支持多模态输入处理。金融指令包括金融术语、指标计算、规范等专业知识。安全数据是为了满足安全合规要求，为保证大模型输出内容符合金融安全底线，遵从金融价值观而提供的必要输入数据。

（2）微调技术。从大模型参数规模来看，大模型微调分两种技术：一是全量微调（FFT），是对模型的所有参数进行训练；二是高效参数微调（PEFT）仅对部分参数进行训练。在金融大模型训练中较常使用的是PEFT，PEFT可以解决FFT带来的问题，即：FFT的训练成本很高，一般大模型的参数量较多，FFT相当于对模型进行了一次重新训练，FFT进行全参重训之后的大模型能力可能会变更差。PEFT的目的是能够在可控成本的前提下，尽可能地提升大模型在特定领域的能力。

（3）思维链增强。思维链（Chain of Thought，CoT）是通过让大模型逐步参与将一个复杂问题分解为一步一步的子问题并依次进行求解的过程，通过构建模型来模拟人类思考过程，形成一个连贯并符合逻辑的思维过程。CoT被认为是一种开创性且最具影响力的提示工程技术。但传统的CoT一般是线性链式结构，这限制了金融大模型在处理复杂金融领域任务时的推理能力，因此需要采用思维链增加技术（见表1）来提高推理能力。

表1 思维链CoT增加技术

（4）智能体。智能体是指能够自主感知环境、做出决策并执行行动的系统。智能体具备自主性、交互性、反应性和适应性等基本特征，能够在复杂多变的环境中独立完成任务。金融领域智能体可以分为三大模块：感知、记忆和行动。感知是从外界获取信息，记忆是存储知识、处理信息并做出决策，行动是向外界反馈信息。智能体自我反思是对智能体之前的活动进行回顾性思考，以纠正之前错误认知并完善行动决策。

金融大模型安全

大模型在金融领域的实践需要考虑多方因素，除了大模型技术框架对现有金融业务的效率提升以外，金融业务的专业性、严谨性及合规要求对大模型在金融领域的应用实践也提出了更加严格的风险防控措施要求。金融大模型安全挑战主要分为内生安全及应用安全。内生安全是金融大模型在研发过程中设计的基础设施、数据、模型、算法、训练过程、部署等环节中遇到的安全风险，而应用安全是金融大模型的不合理应用、滥用或恶意使用而引入的决策失控风险。内生安全问题应由大模型研发团队关注，应用安全则需要法律法规和行业管理规范来监管和控制。

1.金融大模型内生安全。金融大模型的研发生命周期可分为数据收集处理、模型训练、模型部署和模型落地应用四个阶段。其中数据收集处理阶段主要收集、处理、储存大模型训练需要的预训练数据、安全数据和金融指令等；模型训练阶段对海量数据进行预训练、调参、对齐、构建智能体等；模型部署是将训练好的大模型适配特定的硬件资源，并尽量提高大模型的实时性和推理效率；模型落地应用是用大模型解决各种实际的金融任务。

金融大模型的内生安全风险在不同的生命周期阶段有所不同，也有部分安全风险贯穿在全研发生命周期中（见表2）。在数据收集处理阶段，潜在数据泄漏、数据投毒等风险；在模型训练阶段，潜在后门攻击、数据泄漏、数据污染、模型篡改、模型窃取攻击、AI组件漏洞等风险；在模型部署阶段潜在平台漏洞、硬件漏洞、供应链投毒等风险；在模型落地应用阶段，潜在事实性错误、隐私泄漏、提示注入、对抗攻击、内容安全、大模型滥用、伦理安全等风险。

表2 金融大模型常见内生安全风险举例详解

2.金融大模型内生安全应对。金融大模型的安全风险多种多样，既有模型内部天然具有的不安全性，如数据泄露、隐私安全等风险也有外部的恶意攻击、大模型滥用等风险。为提升金融大模型的安全性、可靠性、公平性、隐私性、可解释性和鲁棒性，需要有相应的安全应对策略。内生安全应对可以从提升数据质量、强化模型学习、减少幻觉、安全评测和提升硬件安全等几个方面进行研究，以保证金融大模型的数据安全稳定、算法可解释、模型决策可信，应用合法合规和环境安全可靠。对于外部风险主要由国家法律法规和行业管理规范来进行监管规范。金融大模型安全框架是从全局视角剖析大模型训练、生产及应用中存在的安全风险问题，为大模型的研发及应用提供安全指导，其安全目标是构建可信、可控、可解释、可溯源的金融大模型，安全框架（见表3）主要包括大模型安全管理、数据安全、模型安全、环境安全和攻防安全。

表3 金融大模型安全框架内容详解

总结与展望

当前金融大模型发展尚不成熟，面临着诸多安全隐患与风险。可以预见，随着深度学习技术的发展和研究逐渐深入，未来大模型的攻防将在动态抗衡中不断升级，金融大模型需要应对的新型安全威胁将不断涌现和升级，建立完善统一的大模型安全评估框架、探索有效的防御机制、实现金融模型安全监管和可控生成，以及促进大模型安全生态的建设等任务迫在眉睫。

（此文刊发于《金融电子化》2024年10月上半月刊）

新媒体中心

主任 / 邝源

编辑 / 姚亮宇傅甜甜张珺邰思琪

金融电子化

面向金融界科技人员、业务人员，在金融信息化建设中，为领导决策提供参考，为科技人员和业务人员提供交流的园地以及了解科技应用的窗口，为读者提供金融信息化发展最前沿的各类知识和信息。

最新文章

何青：人工智能对金融行业发展变革的影响分析

案例 | 重庆三峡银行授信业务管理系统基于OceanBase分布式数据库的实践

技术应用 | 中小城商行智能运维平台研究与实践

业务创新 | 新质生产力赋能金融基础设施建设的思考

斯洪标：数据要素在普惠金融领域的应用探索

金融标准化科普系列 ① | 金标院支持金标委秘书处开展哪些工作？

爱廉说 | 清廉中国廉洁准绳寸而度之

《金融电子化》2024年11月刊（下）精彩抢先看！

技术应用 | 应用研发安全性评价体系探索

业务创新 | 创新金融服务，助力民宿做精做专

杨强：“人工智能 +”的国际探索及中国经验

大模型技术助力保险行业提质增效——国寿财险大模型技术的应用与思考

观点 | 商业银行核心系统单元化改造的研究与思考

案例 | 知行合一，有“理”有“具”的企业架构建设实践分享

黄裕洋：证券期货业数据安全体系建设研究

技术应用 | 湖仓一体激发业务发展新动能

技术应用 | 企业级业务建模在银行核心系统建设中的应用

技术应用 | 业务安全自动化渗透测试框架探索

腾讯云天御，技术助力银行守护风控“生命线”

实战 | 双线驱动，AI赋能，农业银行数据治理实践与展望

技术应用 | 基于业务流程模型的监管标准化数据报送分析研究

业务创新 | 银行数智化转型赋能首都智慧金融——基于数智化运营体系方案的研究

华明：拥抱数字浪潮，谱写西证新篇

技术应用 | 交通银行青岛分行新质生产力驱动下的网络策略自动化管理研究与实践

爱廉说 | 清廉中国以文为脉清风护廉

百度智能云智慧金融：共创数智金融新时代

技术应用 | 测试技术革新：驱动金融科技安全高效赋能行业数字化转型

技术应用 | 大模型在金融领域的应用与安全研究

技术应用 | 新一代全景式智能运维平台的探索与实践

陈晓军：激活数字化经营新动能，打造领先的数字化银行

专题 | 金融机构的大模型AI+之路

金融安防 | 基于AI因子体系的智能反洗钱系统建设

万祖齐：夯实数据质量基石，释放数据要素潜能

实战 | 以专业化与规范化的运维服务体系为信创云加速

学术前沿 | 利用ESG工具，促进企业绿色低碳发展

专题 | 释放“数据智能”乘数效应，共筑金融安全新生态——马上消费数据治理、共享与应用实践

专题 | 提升数据价值驱动能力，牢牢把握“数字金融”的“势”与“实”

专题 | 农信机构金融科技治理体系建设的思考与探讨

业务创新 | 园区场景生态建设创新实践

《金融电子化》2024年11月刊（上）精彩抢先看！

爱廉说 | 清廉中国廉韵千年

基层实践 | 央行政策推动科技金融发展的探索分析

金融密码强国筑基——2024年“金融密码杯”密码应用和技术创新大赛圆满收官

专题 | 深入落实金融科技发展规划，做好数字金融大文章

技术应用 | 建设银行企业级湖仓一体架构实践

业务创新 | 积极打造“数绿融合”新金融服务

专题 | 金融机构外部数据应用现状、难点及应对实践

金融安防 | 银行业金融机构安保领域声誉风险防范探析

王军：以数字金融构建金融服务乡村新生态

金融安防 | 银行新业务场景衍生风险的分析与研究

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉