【前沿】AI大模型与金融将如何耦合和应用——以信用评级为例

财富   财经   2024-04-16 20:18   上海  

本文刊登在2024年3月28日出刊的《上财风险管理论坛》杂志2024年第1期(总第27期)“前沿”栏目,经过作者的授权在“风控博士沙龙”微信公众号发布。

声明:文章的版权属于作者,如需转发请事先征得作者本人及风控博士沙龙的同意。文章的观点仅代表作者个人的观点,不代表所在机构的观点。


作者简介


包煜楠,曾任职于上市证券公司、保险资产管理公司、咨询公司和金融科技公司,拥有丰富的实务经验和多款AI产品研发成果。研究领域为金融机构数智化转型、金融大模型、AI在投研和风控领域的应用与产品化等。兼任浙江大学金融科技研究院研究员,中国银行业研究中心研究员。


 


一、大模型(LLMs)概述

   

大型语言模型是一种先进的人工智能技术,它能够理解、生成和处理自然语言文本。这些模型在大规模文本数据上进行训练,通过深度学习技术学习语言的语法结构、语义关系和语境,从而具备了强大的语言理解和生成能力。以下是大型语言模型的一些优势和特征:
    
(一)多功能性
     
大型语言模型可以应用于多种任务,包括文本生成、机器翻译、问答系统、情感分析、自动摘要等,因此具有广泛的应用领域。
    
(二)语义理解与文本生成
     
LLM能够处理含有歧义、隐喻或多义性的文本,分析和理解文本中的上下文信息,以及情感语义判断能力,从而更准确地生成或解释特定的文本内容。这使得它们在自然语言理解和生成任务中表现出色。LLM可以根据给定的提示或上下文生成自然语言文本,如写作文章、生成对话、自动生成代码等。
     
(三)模型规模巨大
     
LLM通常拥有数十亿甚至数百亿的参数,这使得它们能够学习并捕获复杂的语言结构、语法规则、语义关系和上下文信息。LLM可以支持多种语言,尽管不同语言之间的支持程度可能有所不同。
     
(四)预训练与微调
     
LLM在大规模文本语料库上进行预训练,从中学习通用的语言知识。然后,通过在特定任务上进行微调,如问答、翻译、摘要生成等,使模型适应特定领域或任务。



金融适配性


总的来说,大型语言模型在处理自然语言任务(三大场景:读、查、写)方面具有巨大的潜力。假设足够大的模型规模,赋予更多的参数量记忆充足的金融知识,大语言模型其内含“能力涌现”,为之后的“指令微调”(ITF)和“思维链”(COT)的“价值涌现”激发打下了坚实的基础。未来多模态的大模型对于金融的助益和想象空间将要更大,贯穿金融业务链条的各个环节,或将重塑金融行业。
     
不过,大型语言模型在金融领域的应用潜力巨大,但也面临一些挑战需要克服。
     
一是专业要求高:金融领域的专业性要求较高,需要对金融市场、产品、法规等有深入的理解。因此,大型语言模型在处理金融任务时需要具备丰富的金融知识,并能够理解复杂的金融术语和概念。这需要通过专门领域的数据和知识进行训练和优化。
      
二是合规要求严格:金融行业的合规要求非常严格,涉及到信息安全、个人隐私保护、反洗钱等方面。在应用大型语言模型时,必须确保数据的安全性和隐私保护,同时遵守金融监管机构的相关规定和法律法规。
      
三是安全需求高:金融数据的安全性至关重要,一旦泄露或被篡改可能带来严重后果。因此,在应用大型语言模型时,需要采取严格的安全措施,包括数据加密、访问权限控制、安全审计等,以确保数据的完整性和机密性。
       
四是相比于传统机器学习模型做决策(判断、预测),应用于算法交易、动态定价引擎、需求预测等。大语言模型更多是产出内容、灵感,答疑解惑,应用于文本处理、逆向工程、多模式业务内容生成、自然语言交互和指导。
       
为了克服这些挑战,可以采取以下措施:
      
一是注入金融专业知识和联网查询数据:具备行业知识和数据提炼的“行业大模型”是大模型能力在行业落地的最佳途径。巨大的金融垂直类语料的训练数据,包括:数字化的书籍、财经新闻和网页,公告和研报等;基于多轮对话进行记忆和推理,捕捉用户投资交易意图,引导达成业务;擅长理解金融领域的开放领域文字输入,以金融专业的文风生成答复。
      
二是专业的指令微调:由于预训练任务的本质是“续写”,该方式一定能够很好的回答用户的问题;因为无法保证训练数据中存在规范的“一问一答”格式,造成预训练模型通常无法直接给出用户想要的答案,所以需要指令微调。指令微调系指模仿用户“精心编写”在对话过程中可能询问的问题及答案。该过程人工标注成本巨大:只有人还不够,需要 “专业”且“认知一致”的标注团队,尤其在金融垂类的专业领域。
      
三是保障安全合规:在应用大型语言模型时,采取安全合规的技术措施,如数据加密、访问控制、身份认证等,以确保数据的安全和合规性。
     
四是密切合作与沟通:与金融监管机构和专业人士进行密切合作,了解行业最新的合规要求和监管政策,以确保大型语言模型的合规性,并及时调整和更新模型。综上所述,尽管在金融场景下应用大型语言模型面临一些挑战,但通过合适的技术手段和合作方式,可以充分发挥其潜力,为金融行业带来更多的价值和创新。



三、大模型应用于金融的泛想

   

(一)风险管理
     
大模型在金融风险管理领域的适配性最高,可以应用于打造集风控知识问答、文化宣导、风险监测、报告辅助生成于一体的智能助理,协助风控人员高效高质的完成风险管理动作,具体如:
     
1、风险专家智答:支持通过各类文档上传的方式,快速打造专业领域知识库,激活内部知识库,借助大模型对答的形式,让知识检索(尤其是银行的授信政策等文档材料)变得更加容易;
     
2、风险文化宣导:通过文生图、文生视频的方式快速将一篇纯文本的知识内容,组装成一张张图片或者视频;同时辅助以文章润色和数字人形象可以让视频更加出彩。
     
3、风险智能监测:利用大模型打造业务专属的风控AI助理,协助风控人员完成日常的舆情搜索、舆情监控、舆情解读、指标监控、风险分析、预警、提示处置等。
     
4、风险报告、尽调报告辅助生成。实现报告数据快速检索,图表生成,大幅提高报告写作效率。
     
5、业务风险经验和规则泛化,基于大模型的AI Agent能力,泛化比如财务粉饰,或者信用评级领域沉淀的专家规则经验体系。
    
(二)个人财富规划
     
目前金融类的数据、资讯收集非常繁琐。互联网上的信息是过载和冗余的,而传统搜索引擎的效率也极低。比如Morgan Stanley内部财富顾问服务平台,与GPT4战略合作,采用内部知识库(研报、论文、策略)训练,支持全球的财富管理顾问员工。
    
(三)运营
     
按紧急程度和客户细分对电子邮件、运营信息等进行排序、分类等。再比如,上传PDF报告,提取材料中的估值表数据并分析,降低人员负担。同时,大模型也可以提升智能客服与虚拟助手,对传统客服场景升级,提供“有温度”的客服,无需手动配置问答对,实现自主学习完成客户智能聊天回复,增强聊天工具的辅助作用,极大提升用户体验。
   
(四)研究
    
比如可以用多语言和多模型撰写全球、分资产类别、主题、图表、风险分析等研究内容。根据预设模板或手工输入的prompt,自动检索相应数据,并确定最佳展现方式(数据列表、图片等);按照模板或prompt形成对应框架脉络的报告模板,并将检索出的数据填入框架模板。按照模板或prompt对需结论性输出的内容进行文本加工并填入框架模板中,形成最终的报告。
     
(五)交易/投资组合管理
     
比如输入自然语言指令,copliot理解输入内容,形成相关选择项由用户进行选择;基于选择内容检索对应数据库,并继续进行语义理解与辅助指令输入;基于用户辅助指令将抽取数据进行加工计算,最终按照约定的展现形式进行结果输出。可回溯参与计算的数据明细。同时,交易执行过程中大模型(比如Broadridge的BondGPT)可以帮助债券交易员询价、推荐、撮合交易,进行实时优化和决策支持。
     
(六)市场营销/业务发展
    
AIGC的金融内容生成与推广:包含配图、活动、海报、视频、热点文章、分析思路和研报、营销话术等各类媒体内容自动生成,结合用户画像进行“千人千面”推送),这是大模型应用最令人兴奋的机会。大模型帮助我们接触更多目标市场内的潜在客户,有机会讲述我们的故事,获得更多的细分市场份额。



四、大模型在信用评级的实践

   

信用评级领域由于沉淀的信用评价体系和经验规则完善且格式化,模板化报告格式标准化程度高,成为大模型在金融领域应用最合适的突破口。
    
评级场景下多维度数据自然语言检索。信用评级场景下,评级分析师需要检索和调用大量的数据和资讯,完全可以基于大模型检索能力及指令辅助,对目标内容进行检索。
    
一是输入自然语言指令,copliot理解输入内容,形成相关选择项由用户进行选择。
    
二是基于选择内容检索对应数据库,并继续进行语义理解与辅助指令输入。
    
三是基于用户辅助指令将抽取数据进行加工计算,最终按照约定的展现形式进行结果输出。
      
四是可回溯参与计算的数据明细。
    
基于金融大模型综合分析能力(需要经过评级数据的指令微调)以及多维度数据库,评级报告的自动生成和撰写。
    
一是根据预设模板或手工输入的prompt,自动检索相应数据,并确定最佳展现方式(数据列表、图片等)。
    
二是按照模板或prompt形成对应框架脉络的报告模板,并将检索出的数据填入框架模板。
    
三是按照模板或prompt对需结论性输出的内容进行文本加工并填入框架模板中,形成最终的报告。
      
信用定价和预警,具体如下:
    
一是数据收集与准备:收集关于企业客户的各种数据,包括财务报表、交易记录、行业数据等。确保数据的准确性和完整性,进行数据清洗和预处理。
    
二是监管和风险规则扫描和学习:自主学习监管发文,对相关监管指标进行标注。理解监管指标的数据加工逻辑,查找数据并对指标进行计算。对比监管合规红线与现有指标的真实值,超过阈值则进行预警信号推送。
    
三是特征工程:从收集到的数据中提取与定价相关的特征。这可能包括企业的财务指标、行业竞争情况、市场趋势等。特征工程的目标是为模型提供有意义的信息,以便更好地进行定价决策。
    
四是定价策略制定:基于模型的预测结果,制定智能化的定价策略。涉及到确定价格的基准、考虑市场因素、竞争情况等。
      
五是实时定价决策支持:将训练好的模型嵌入银行的定价系统中,以便在企业客户申请产品或服务时提供实时的定价建议。模型的预测可以作为决策者制定最终定价的参考。


    (完)


征稿启事



《上财风险管理论坛》杂志2024年第2期(总第28期)将于6月28日出刊,本期主题是"新质生产力视角下的风险管理",欢迎广大业界人士赐稿。


针对投稿文章的要求如下:

1、文章的选题需紧扣风险管理的主题,题目自拟;

2、文章撰写的要求包括:一是实用性,文章贴近并服务于日常工作;二是可读性,文风朴实,行文流畅;三是文章字数不少于2000字,可以配有图和表;

3、文章请投杂志的专用邮箱shufe_cro@126.com,征文截止日是615日


文章发布后将赠送作者当期精美的纸质期刊一本。


《上财风险管理杂志》编辑委员会

2024年4月2日


 

为加强《上财风险管理论坛》杂志的作者团队与读者之间、以及读者相互之间的沟通与交流,已建立《上财风险管理论坛》读者交流微信群,目前成员接近1200人,包括知名金融机构的首席风险管理、风险管理部负责人、风险管理领域知名学者等专业人士,竭诚欢迎广大的风险管理从业者加入该微信群,共同打造一个讨论风险管理的专业社区。如希望入群,烦请给本微信公众号留言(留下个人微信号),我们将会主动联系并且邀请入群!



为了积极推进AI大模型在金融尤其是风险管理领域的落地,创建了“衍生品、风控与AI大模型社区”微信群,目前成员接近1300人,包括了金融机构高管、AI大模型科学家等,致力于打造一个集学习、讨论金融衍生产品、风控以及用AI大模型实现前两者功能的开发社区!如希望加入,请留下个人微信号,我们将主动联系并邀请入群!


公 告


人类已步入通用人工智能(AGI)时代,AI大模型正在变革风险管理。专注于风险管理领域的AI大模型——CRO_大模型V1已于2024年3月9日正式上线并发布,关于该款大模型的功能与使用的详细介绍,请参见以下的微信推文

【公告】风险管理AI大模型——CRO_大模型V1正式发布

 


相关阅读(最近五篇) 

【洞见】融资租赁公司面临的风险新常态

【洞见】期货趋势跟踪策略的风险管理设计

【洞见】商业银行托管业务反洗钱风险管理浅析

【洞见】从风险识别角度论风险的分类及转化

【前沿】场外衍生品模型验证与模型风险管理实践


荐书 

【荐书】Python金融实战案例精粹(第2版)

【荐书】基于Python的金融分析与风险管理(第2版)


云课程  

期权、期货及其他衍生产品(第九版,全部三百六十讲视频)

风控博士沙龙
金融的本质之一是风险管理,本沙龙努力打造成为最受人尊敬的风险管理交流与分享平台。沙龙的口号是“风险管理让金融变得更加美好!”
 最新文章