这是“西欧欧”的第164篇原创文章
上篇文章简单探讨了“银行大模型”的应用现状及重点领域,原本打算畅想下大模型在银行业务场景中的落地路径,然后就看到了下面这篇极度打脸但又人间清醒的“攻略”——如何打造一个拖垮公司的大模型?
第1步:先砸十个亿买卡。做大模型,要有大格局,舍不得孩子套不着狼。什么X100、Y100……专挑算力强的买。正规渠道没货了?不能怂!加价也要整起来。
第2步:从顶流公司挖大牛来坐镇首席科学家。必须是业界扛把子级别的大牛,就职于顶流AI公司比如“CloseAI”,经常在各种会议上高光出镜的那种。能把整个团队都带过来最好,成建制、好管理、出活儿快。
第3步:定战略,当卷王。模型参数至少要万亿级别,当不成卷王,就只能被卷死。再来个“智算中心”,算力至少达要1000PFLOPS,自己训练完大模型,还能把算力开放出来给同行。
第4步:万事开头难,从数据准备开始全员鸡血加班。数据不够怎么整?公开一部分,自有一部分,交易一部分。拿到数据后,得清洗处理,全体动员做标注,老板亲自下场,主打一个陪伴。
第5步:开始玩命训练,不出意外的话快出意外了。服务器挂了、存储速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……什么?!Checkpoints没保存?反复回退,反复调参,反复排雷。
第6步:内部开始自我修正。问题一多,团队就乱了,人都变得很浮躁。公司原有的主营业务停滞不前,业绩下滑。
第7步:不管产品行不行,市场宣传要先行一步。“我们来了!”广告要全渠道、全媒体覆盖。必须要业界感知到我们来势汹汹的霸气。
第8步:生态伙伴少不了,气氛必须搞起来。先结盟5000家合作伙伴,达成意向合作。第二天,大家联合发发新闻稿,必须让吃瓜群众充满期待。
第9步:大模型终于“练”出来了。练是练出来了,看上去有点不对劲,莫不是个“大傻子”吧?落地实施,那叫一个难,不知道给谁用,不知道往哪儿用。
第10步:及时止损,人间清醒。然后开始复盘,多么痛的领悟……
据不完全统计,2023年单单中国企业就累计发布了将近300个大模型,这来势汹汹的“百模大战”颇有一番“大炼AI”的架势。尽管上述“攻略”有夸张的成分在,但也从侧面暴露出被誉为“下一个科技风口”的AI在资本的裹挟下已经开始出现一些浮躁或扭曲的乱象,简单来说有如下几类问题:
大模型的应用场景尚未清楚就匆匆上马,盲目跟风;
热衷请专家、立概念、讲故事,饼能画多大就画多大;
为了能把故事讲圆,刻意追求所谓的“自建”和“闭环”;
本末倒置,过于关注热点创新业务而耽误主业;
重推广轻产品,以吸引投资为导向,而忽略了业务价值创造。
如此看来,在跟集万千宠爱于一身的大模型套近乎时,最好还是掂量一下,务必以创造业务价值为导向,在明确业务需求的前提下规划相应的落地路径,避免出现虎头蛇尾竹篮打水一场空的情况。
下面我们结合一个虚拟案例,简单聊聊大模型在银行业务场景中的落地路径。
案例背景:某银行希望引入大模型来提升其信贷审批流程的效率和准确性。当前,信贷审批过程大量依赖人工审核,效率低下且容易出错,银行希望通过大模型自动化地处理和分析客户的信贷申请,以快速准确地做出审批决策。
第1步:业务理解和需求分析
与信贷业务部门沟通,深入了解信贷审批流程的具体细节和业务需求。
确定大模型在信贷审批中的应用场景,如客户信用评分、欺诈检测、还款能力预测等。
第2步:数据收集和处理
收集历史信贷申请数据,包括客户个人信息、财务状况、信贷历史等。
对数据进行清洗和预处理,去除无效数据和异常值,确保数据质量和一致性。
根据业务需求对数据进行特征工程和标签化处理,提取出对模型训练有用的特征。
第3步:模型选择和训练
选择适合信贷审批场景的大模型架构,如深度学习模型、决策树模型等(此处可以考虑与成熟供应商进行合作)。
使用处理后的数据对模型进行训练,通过调整模型参数和超参数来优化模型性能。
在独立的验证集上评估模型的准确性、召回率等指标,确保模型满足业务需求。
第4步:模型集成和部署
将训练好的模型集成到银行的信贷审批系统中,确保模型能够与现有系统无缝对接。
开发相应的API接口,使信贷审批系统能够调用模型进行实时推理。
对模型进行部署和测试,确保模型在实际环境中能够稳定运行并输出结果。
第5步:业务验证和调优
在实际业务场景中对模型进行验证,观察模型的审批决策是否符合预期。
收集反馈数据并进行模型调优,改进模型的性能和准确性。
建立模型性能的监控机制,定期评估模型的性能并进行必要的调整和优化。
第6步:上线和监控
经过充分验证和调优后,将模型正式上线并投入生产环境使用。
对模型进行持续的监控和维护,确保模型在实际运行中的稳定性和可靠性。
定期评估模型的效果和业务价值,为后续的模型优化和迭代提供依据。
或许有朋友会问,上述案例中所描述的信贷审批业务需求,通过小模型同样能够实现,为何还要劳神费力上大模型呢?
简单来说,选择大模型还是小模型,主要取决于具体的业务场景应用需求,以银行业务为例,大模型更适合处理需要深度分析和复杂决策的场景(如企业贷款审批、投资策略制定或全面的客户关系管理等),而小模型则更适合处理快速、简单的决策任务(如ATM交易欺诈检测、基本客户查询响应或个性化推荐等)。
当然除此之外,银行还需要综合考虑自身的资源禀赋、性能要求以及隐私和安全等方面的因素,或者也可以采用混合方法,结合大模型和小模型的优势来处理不同复杂度的任务。
最后,尽管银行业对大模型的关注日益升温,并且在营销推广、渠道运营、开发运维等领域取得一定成效和收益,但对于天然厌恶风险的银行而言,仍处于发展初期的大模型在其业务侧的全面落地还面临诸多挑战,不过“挑战”即“机会”,也希望广大同业能够抓住这个难得的机会,共同推进AI技术在银行数智化转型中的应用落地及价值创造。
……一家之言,欢迎拍砖……
既然都看到这儿了
不妨点个“赞”或“在看”
抑或“转发”给朋友
手留余香
相关文章
『银行大模型』应用现状及重点领域
深入浅出聊聊『大模型』
人工智能『产业结构』简析
关于『AI』的8个热门术语解读
聊聊银行『数字化运营』的五大趋势
2024年,我为何要聚焦『数智化运营』?
2023年度总结:『吐故』与『纳新』
作者简介
数字化营销与运营领域17年老兵、混迹于金融与互联网圈的斜杠中年、《数字银行》专栏作者、“数智化运营”布道者,操盘过数款千万级用户体量的互联网产品,专注银行数字化运营咨询、运营体系构建与策略规划落地。拙文皆为日常工作中所沉淀的方法/心得/案例/见解,望助同道中人少走弯路早有收获,善莫大焉!