技术应用 | 投行业务数智化转型的探索与实践——以兴业证券投行智能底稿系统为例

学术   财经   2024-11-14 11:33   北京  

文 / 兴业证券股份有限公司金融科技部 李园园 邹晨媛

兴业证券股份有限公司投行质量控制部 赵薇




2023年3月,兴业证券智能化技术基座项目上线,将人工智能技术与投行电子底稿核查场景进行深层结合。该项目针对投行底稿工作和核查场景的若干业务痛点,利用自然语言处理、文档全景结构识别、金融文档专用OCR等技术,提高了投行业务质量和风险挖掘能力。本文将详细介绍兴业证券在投行业务数智化上的先行探索经验,以及将投行电子底稿系统从监管导向变为生产力导向的落地实践经验。



投行数智化转型势在必行


2022年1月,中国人民银行发布《金融科技发展规划(2022—2025年)》,其中指出“以加快金融机构数字化转型、强化金融科技审慎监管为主线,将数字元素注入金融服务全流程”,并明确提出将金融数字化打造成金融机构的“第二发展曲线”。2020年2月28日,中国证券业协会发布实施《证券公司投资银行类业务工作底稿电子化管理系统建设指引》,证券公司投行业务纷纷加速推进数字化转型,以提高工作效率和风控能力。


当前证券行业正在发生诸多变化,监管要求不断细化,对证券公司提出了更高的合规要求;行业竞争愈发激烈,逐渐从“数量竞争”转变为“质量竞争”;行业数字化转型不断推进,对技术实力和业务需求的结合和落地能力提出了更高的要求。面对这些变化趋势,兴业证券已经从数字化基础建设阶段正式迈入数智化全面赋能阶段,通过大投行平台为载体、数智化转型为引擎,体系化推进创新优化,持续助力投行业务发展动能、严控项目质效。



从电子化到数智化的难点


投行工作底稿是证券公司开展投资银行类业务并出具专业意见的重要信息源,在数字化转型的背景趋势下,运用前沿技术提升工作底稿的管理和运用水平,对于更好支撑信息披露、防范投行项目风险具有重要意义。从一定程度来说,投行底稿已成为从投行展业竞争中突围的重要抓手。许多证券公司在过去的数字化实践里,针对监管的要求和业务发展的需求,已经逐步实现投行底稿电子化。但投行底稿电子化的数智化阶段仍然是一片蓝海,在赋能业务和内控管理上尚有诸多痛点:一是智能化程度低。底稿系统普遍作为归档类管理系统,缺少深入业务的智能化场景效率工具,导致人工审核压力大。二是文档处理能力有限。电子底稿系统对文档内容的处理仅限于利用通用光学字符识别技术(OCR)实现底稿内容的文字识别,不具备完整的文档智能化技术能力。三是底稿细节把控能力弱。底稿文档当中有海量的关键细节,需要人工逐个审阅校对,阅览体验不佳且风险挖掘能力差。



从电子化到数智化的路径


针对上述提到的痛点,兴业证券以数智融合为导向,基于计算机视觉、金融场景专用OCR、文档全景结构识别、自然语言处理和人机协同等一系列技术手段,在投行底稿审核业务场景开展了数智化转型创新,探索深度学习技术在投行工作底稿管理应用的智能化场景,构建面向投行工作底稿管理系统的智能化技术底座(见图1)。

图1  智能底稿的核心:电子底稿结构化识别


1.智能底稿的核心难题:对电子底稿的结构化识别和精确解析。实现底稿智能化的第一步是要对底稿内容进行精确解析。但底稿文件中往往包含标题、段落、表格、图片、图表、印章、落款等多种元素,文档内容信息散乱,排版样式复杂,传统OCR类文档识别模型瓶颈凸显。为解决这一问题,兴业证券采用专门针对金融场景的OCR技术,配合投行底稿结构化模型,确保其识别的效果能够满足投行底稿高准确性的需求。例如,底稿中常见的印章遮挡、水印遮挡、模糊扫描件,也能被准确解析出来。


2.业务需求导向:从技术创新到场景赋能。兴业证券从投行工作底稿管理系统的实际需求出发,以智能底稿模型核心技术栈为根本,探索深度学习技术在投行电子底稿管理领域的应用,构建面向投行工作底稿管理系统的智能化技术底座,逐步落地了印章落款合规性检测、文档智能比对和底稿智能阅览等多个针对投行业务工作高频痛点的功能,具体如下。


(1)印章落款合规性检测。兴业证券的智能底稿系统中内嵌文档智能模型,具备智能识别印章和对印章自动进行核查的功能。


智能印章识别功能:通过采用各类印章样本进行的训练和优化,文档智能模型具有文档中印章识别和信息提取的能力。在实际应用中,模型可对圆章、椭圆章、带有少数民族文字的印章等多种形式的印章进行快速识别和提取。


印章自动核查功能:在应用层面,本功能可自动检测各底稿项是否已盖章、识别印章主体并校验与底稿主体是否一致、同一主体印章编号是否一致(见图2)。文档智能模型将提示核查人员注意核查编号问题,核查结果以目录的形式汇总展示,方便业务人员核查与定位底稿项,提高风险挖掘的深度和准确度。

图2  印章检测应用效果


(2)文档智能比对,包括重复多次核查差异点功能、校验用印文件与电子件版本一致性功能。


重复多次核查差异点功能:底稿文件需要经过多轮审核和修改。为提高审核人员核查效率,兴业证券在底稿系统、投行业务管理系统内均集成了文件版本对比功能,可在底稿提交过程中将修订后的电子版文件与原文件进行对比,审核人员可基于对比结果重点复核差异内容,大大提升底稿审核工作的效率。


校验用印文件与电子件版本一致性功能:对于需要用印的文件,审核人员经常要对该文件用印版与经审核的电子版进行自动比对,确认其版本一致性。通过智能比对工具,审核人员可以快捷校验一致性,既提升了审核效率,也避免了人工审阅可能导致对细微修改的遗漏。


(3)底稿智能阅览(见图3),包括底稿极速加载功能和零操作文件自动连读。

图3  零操作文件自动连读功能应用效果


底稿极速加载功能:通常,投行电子底稿文件篇幅较长、在实际审阅过程中普遍存在加载速度慢的问题,兴业证券结合底稿审核实际需要,优化PDF渲染引擎,使得文件加载速度较传统开源引擎有了较大提升。


零操作文件自动连读:在底稿核查过程中,核查人员需要反复进行文件切换。结合上述的“底稿极速加载功能”,兴业证券在电子底稿系统中将文件目录树下一个文件的文件头部与尾部预先下载到缓存并预渲染。实际操作中,审核人员只需连续滚动鼠标即可实现文件的切换,无需多余操作,极大提升了业务人员的审阅效率和阅读体验。


3.拓展智能化的应用场景:从投行底稿延展到更多业务场景。兴业证券将增强的OCR能力、底稿结构化识别能力和表格识别、关键信息点识别提取等核心文档智能技术成功应用在投行智能底稿系统当中,这一成功案例在证券公司内部其他业务场景中,特别是文档密集型工作中有诸多延展可能性。


例如,在底稿智能化场景上,可以进一步利用文档智能技术将底稿结构化,将底稿文件分类、提取关键信息、建立信息关联等,实现底稿信息的自动复核和溯源;或者与大模型结合,先由文档智能模型提供更完备的文档输入能力,后由大模型实现底稿问答、可搜索的内部文档知识库等。



数智化转型的启示


为加强投行业务工作底稿管理,兴业证券以数字化转型为契机和抓手,应用前沿科技赋能投行工作底稿管理系统,有效提升工作底稿管理水平。通过投行部门底稿系统的数字化转型实践,兴业证券在推进投行核心业务数字化方面积累了宝贵经验,主要启示包括:一是从局部试点到系统化平台。数字化转型需从局部场景着手,取得初步业务验证及技术验证,然后迈向系统化平台建设,这样可以降低整体实施风险。二是业务导向与技术赋能结合。数字化项目应以满足实际业务需求为导向,而非单纯追求技术本身的创新。与此同时,也需关注技术创新与突破,确保技术可以真正赋能业务。三是科技助力合规,合规创造价值。兴业证券长期秉持强合规的意识,积极运用科技手段将合规要求落到实处。例如,将印章审核功能同底稿审核功能相结合,进一步完善投行底稿的风控审核能力。


兴业证券的投行智能底稿系统,作为投行工作场景与前沿科技创新结合的又一重大成果,将持续推动科技与业务的双向融合与协同创新,深化赋能兴业证券以客户为中心、平台为载体、数智为引擎的集团数字化建设和转型战略。未来,兴业证券将坚定不移地推动科技与金融的深度融合,通过持续的创新和优化,不断提升对客户全生命周期需求的精准挖掘与分析能力、增强服务对接能力、加强企业自身的合规风险识别和防范能力,书写科技金融领域的崭新篇章。


(此文刊发于《金融电子化》2024年9月上半月刊)








新媒体中心

主任 / 邝源

编辑 / 姚亮宇  傅甜甜  张珺  邰思琪

金融电子化
面向金融界科技人员、业务人员,在金融信息化建设中,为领导决策提供参考,为科技人员和业务人员提供交流的园地以及了解科技应用的窗口,为读者提供金融信息化发展最前沿的各类知识和信息。
 最新文章