大模型驱动,蚂蚁集团实现增长转变

学术   科技   2024-12-09 19:00   北京  

20年前,支付宝为交易双方建立信任而生;20年后,全新的蚂蚁集团锚定AI和数据要素技术发力,用科技普惠来实现增长转变。在生成式AI的赛道上,具备金融和科技双重属性的蚂蚁集团选择从基础大模型和行业大模型来切入,在行业场景中发掘新的价值落点,推动商业化加速落地。

作为国内大模型领域的“头部玩家”之一,蚂蚁集团始终坚持AI优先的公司战略。此前,蚂蚁集团董事长兼CEO井贤栋透露,下一个十年,蚂蚁集团将以更大力度投入科技创新,聚焦人工智能和数据要素技术,开启蚂蚁科技的全新未来。面对新一轮的AI比拼,井贤栋在2024世界人工智能大会上还透露蚂蚁集团将发力专业智能体,加速产业应用的计划。那么,蚂蚁集团具体是如何依靠技术优势和业务布局,发力生成式AI的呢?本文将对此展开深入论述。

1


聚集科技,蚂蚁大模型深耕基础性能

在新一轮AI比拼中,蚂蚁集团作为国内较早布局生成式AI的厂商,展示出了其强大实力和深谋远虑。在发展生成式AI过程中,独具特色的是蚂蚁集团在AI战略层面的整体布局,包括业务整合、技术革新、产品升级等;其次是落实到模型层面,对大模型基础性能的细致打磨和迭代升级,包括基础大模型能力的训练和垂直行业大模型的打造。

蚂蚁集团AI整体发展历程

2004年12月,支付宝正式注册成立;2020年7月,蚂蚁金服正式变更企业名称为蚂蚁科技集团股份有限公司;2024年1月,蚂蚁集团成立AI创新研发与应用部门(NextEvo)……从公司创立到AI业务整合、创新,蚂蚁集团走过了20年的历程。那么,从金融起家到如今大力发展生成式AI以服务各行各业,蚂蚁集团是如何精密布局的?

从蚂蚁集团的AI技术研发路径和产品革新历程来看,其AI发展整体上延续了我国AI发展的大趋势:在AI 1.0阶段,以基础设施层、技术层、模型层发展为主,包括硬件设施的布局、云服务和数据库的搭建、以及大模型的更新迭代,比如2015年蚂蚁集团就推出了其云计算服务“蚂蚁金融云”;2010年搭建了分布式关系型数据库OceanBase。在AI 2.0阶段,以发展和运用生成式AI能力为主,从模型层开始逐步升级大模型的多模态技术,并将大模型能力逐渐覆盖到行业小模型;而在模型层基础上,又发展了智能体(Agent)技术、提示词工程(Prompt)、数据要素技术等应用技术,比如2024年蚂蚁集团宣布启动支付宝智能体生态共建计划,并推出智能体开发平台支付宝“百宝箱”,向行业开放智能体构建能力,可0代码、最快1分钟创建专属的服务智能体,并一键发布到支付宝小程序、支付宝App、支小宝App等。最终,在应用层上开发出了面向B端、C端、G端的各项应用。


蚂蚁集团AI发展路径(仅展示部分重点产品)


可以说,AI 2.0阶段是在1.0阶段硬件和技术的基础上,进一步发展了人工智能的生成式能力,并注重拓宽AI原生应用落地场景,实现“AI+”和“+AI”。

蚂蚁集团大模型发展历程

据蚂蚁集团遥感大模型负责人王剑介绍,目前蚂蚁集团积极布局大模型的技术和应用。蚂蚁大模型以全栈布局、长线发展为原则,以创造产业价值为目标,目前已形成包括大模型基础能力、基础大模型、行业大模型、应用产品在内的完整技术链条。

首先在基础能力建设上,蚂蚁集团主要围绕“三力”打造基座,提升大模型基础性能。一是“算力”。蚂蚁集团建设了万卡异构集群的算力系统,其中硬件算力效率(HFU)超过了60%,集群有效训练时长占比90%以上,基于人类反馈的强化学习(RLHF)训练在同等模型效果下训练吞吐性能相较于业界方案提升了3.59倍,推理性能相较于业界方案提升了约2倍,处于行业领先水平;二是“安全力”。蚂蚁集团自研大模型安全一体化解决方案“蚁天鉴”。作为业内首个大模型安全评测工具,“蚁天鉴”打造了大模型“安全测评智能体”,支持AI鉴真功能,包括图像、视频等多模态内容真实性及深度伪造检测,图像识别准确率为99.9%,达到行业最高优秀级(信通院测评)。而2024年7月最新升级的蚁天鉴2.0则拥有超300万的高质量测评题库,支持最高50万/日的饱和式攻击和逐级诱导深度攻击,并实现了1个工作日之内完成测评,全流程自动化率大于99%,体现了AI测评的准确高效;三是“知识力”。蚂蚁集团通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化,形成了完备的知识处理能力。其中,集评测数据集与评测框架一体化的大模型评测平台EVE,能支持语言大模型和多模态大模型的一站式自动化评测。

其次在大模型搭建上,蚂蚁大模型包括基础大模型和行业大模型。王剑提道:“在基础能力之上,我们建设了百灵语言大模型和百灵多模态大模型,并基于这两个基础的大模型,根据蚂蚁集团业务的特点,我们重点关注大模型在金融、医疗、民生、安全、遥感、代码等行业的应用,以此服务消费者和企业客户,从而推动可信智能,服务产业发展。”

在基础大模型层面,蚂蚁集团经历了从语言大模型到视觉大模型,再到遥感大模型的研发路径,其关键技术也从大语言、纯视觉拓展到多模态领域。


蚂蚁集团大模型发展路径(仅展示部分重点产品)


据蚂蚁集团相关负责人介绍,语言以及视觉大模型的发展为多模态大模型的研发提供了很多重要参考。比如大语言模型,当其拓展到多模态领域之后,以往的光学字符识别(OCR)、视觉问答(VQA)等视觉任务都表现出很好的效果;而在纯视觉大模型方面,如基于自然语言处理的图像分割模型(SAM)可以在分类、检测、分割等任务上表现出较强的性能。目前,百灵大模型实现了最新能力升级——不仅突破了以往规模,从基础的语言大模型过渡到千亿参数的视觉语言模型,还扩展了模态,由桥接向原生跨越,支持音、视、图、文等模态。据最新测评数据,百灵大模型的多模态能力在中文图文理解MMBench-CN评测集上达到了GPT-4o水平,在信通院多模态安全能力评测达到优秀级(最高),具备支持规模化应用的能力,能支持AIGC、图文对话、视频理解、数字人等一系列下游任务。可以说,蚂蚁百灵大模型正在朝着成为业界一流的原生多模态模型的目标快速行进着。

从基础能力建设到基础大模型搭建,蚂蚁集团AI的每一步路、每一子棋都下得严密又扎实,但行业要竞争发展、企业要实现商业化,就必然需要让技术实现有效落地。对于蚂蚁集团而言,其通过行业大模型的细分,在各垂直领域创新研发产品,面向社会开放。那么,蚂蚁行业大模型究竟是如何依靠基础大模型升级的?又是如何赋能到具体的行业应用中的呢?

2


垂直行业,金融大模型赋能产业升级

对于搭建行业大模型的必要性,蚂蚁集团副总裁、金融大模型负责人王晓航提道:“通用大模型无法在专业严谨的领域直接对外商用,只有走向垂直行业大模型,才能带来产业价值。”截至目前,蚂蚁集团深耕金融、医疗、民生、安全、遥感、代码等行业,布局了蚂蚁金融大模型、支付宝医疗大模型、蚂蚁代码大模型CodeFuse等行业大模型。


蚂蚁集团行业大模型介绍


对于前身是蚂蚁金服,拥有多年积累的丰富金融行业资源的蚂蚁集团来说,在布局垂直行业大模型之初,就锚定了金融大模型,并将其作为行业大模型的布局重点。2024年9月,蚂蚁集团在外滩大会上正式发布了其打造的金融大模型“1+1+2”矩阵,具体包括蚂蚁工业级金融大模型AntFinGLM、金融专属AI任务评测集Fin-Eval,以及个人金融助理支小宝2.0和专家业务助理支小助两大产品应用。而蚂蚁金融大模型也围绕此矩阵展开了全栈技术布局。


蚂蚁金融大模型全栈技术布局


“四力”合一,解决产业真命题。蚂蚁集团金融行业大模型负责人王晓航在外滩大会上提道:“金融大模型实现落地行业是一个复杂化的系统工程,需要将‘四力’形成合力。”蚂蚁金融大模型具有“四力”,即知识力、专业力、语言力、安全力。

第一是知识力,主要是指金融大模型的底座能力。蚂蚁集团在万亿量级Token通用语料基础上,注入了千亿量级Token金融知识,包括全网公开的金融行业语料约5000亿Token以及蚂蚁集团独家金融语料约279亿Token,并搭建了专属知识引擎。王晓航提道:“小模型时代,蚂蚁集团就积累了深厚的数据资产和产业AI的know-how。”对于国内数据市场而言,我国政府数据资源占据全国数据资源的75%以上,但公开开放给个人和企业利用的规模不及美国的7%,在这种情况下,蚂蚁集团在保险、理财、信贷平台上多年积累的金融行业的私域经验,使其在金融大模型布局上拥有先天优势。

第二是语言力,主要利用大模型的上下文学习能力(In-Context Learning),完成情绪识别任务,包括理解用户金融意图、总结归纳行业资讯、推理分析行业时间等。为了让大模型听懂“人话”,并能像“专家”一样给出意见,蚂蚁集团采用的是“仿金融专家多智能体协同推理机制”,通过AI Agent的建模思路,让大模型派生出计划组、执行组、表达组和评价组4个小组,将总任务拆分为不同子任务并划分给不同小组(智能体)执行。目前蚂蚁金融大模型的情绪识别准确率已经超过了90%,金融意图的识别准确率也已经达到了95%,媲美专家平均水平。

第三是专业力,主要包括工具理解能力(将用户意图转换成一系列的API调用等)、大模型的思维链能力等,蚂蚁金融大模型可通过理解用户语言,精准调用蚂蚁集团体系内完备的数字化金融工具矩阵,给用户提供相应专业服务。具体而言,蚂蚁集团在其金融服务平台上建设有完备的数字化金融工具矩阵,理财侧包括理财选品、产品评测、行情解读、资产配置等六大类服务;保险侧包括产品解读、家庭配置、智能核赔、智能理赔等10多个智能服务。

第四是安全力,要求大模型的生成能力能够对齐社会核心价值观、金融合规要求等规范,主要采用了关键技术RLHF——使大模型基于巨量数据进行持续反馈与强化学习,更好地掌握人类偏好,输出更符合人类预期的结果,比如风险规避水平、投资习惯、安全合规等。

专属评测,全面评估大模型能力。在金融大模型的能力之上,蚂蚁集团推出的金融专属AI任务评测集Fin-Eval,能够从五大维度(认知、生成、专业知识、专业逻辑、安全性)的28类金融专属任务中评估金融大模型的能力,并与国内外第一梯队大模型进行比较。2024年8月,蚂蚁金融大模型已通过证券从业资格、保险从业资格、执业医师资格、执业药师资格等专业试题测试,并率先在蚂蚁集团的财富、保险平台上进行全面应用测试。根据Fin-Eval的专属评测结果,蚂蚁金融大模型能力已经大幅超过当前主流通用大模型,在研判观点提取、金融意图理解、金融事件推理等任务上已经达到专家平均水平。

综上所述,基于金融场景中的大量实践,蚂蚁金融大模型形成了“大模型+知识+服务”驱动的架构,这套架构也全面赋能了蚂蚁集团与金融机构合作的所有数字金融业务的全线升级,成为驱动产业价值高效率转化的底层利器。而离开底层再往上看,行业大模型是如何与蚂蚁集团以往的业务深度融合,赋能其全面升级,让企业实现“降本增效”的终极目标的呢?

3


落地应用,生成式AI服务多元领域

在企业永恒的降本增效命题下,蚂蚁集团基于大模型的底座能力,大力布局发展其生成式AI业务,并以支付宝为主要载体,蚂蚁财富等旗下行业类App为重要平台,打通全域流量,连接亿万用户,加速布局生成式AI应用,包括应用内部AI插件和原生独立型AI App等形式,在出行、政务、医疗、理财等场景提供生成式AI的专业服务。具体而言,蚂蚁集团的生成式AI主要布局了金融、医疗和生活服务三大行业,主要服务形式为三类AI管家,即AI金融管家、AI健康管家和AI生活管家。

生成式AI加码金融,填补专业服务空白

作为蚂蚁集团旗下的全球在线服务亿级用户的财富管理平台,蚂蚁财富在十年发展期间始终坚持利用最新技术升级自身业务。发展期间,蚂蚁财富面临的一大难题是金融产品消费者的专业性不强,而专家顾问资源较少。举例来说,5亿活跃用户中拥有真正成熟理财行为的用户仅占两成,而中国7.2亿基金投资者里,每3600人才能分到1位传统理财顾问来服务。“投多顾少”,对很多普通投资者来说,往往处于专业服务的“无人区”。因而,随着用户侧对专业服务的需求日益扩大,蚂蚁财富迫切需要用相应技术来进行业务升级。

2020年,AI理财助理“支小宝”正式对外上线,蚂蚁财富希望能补足行业专业性服务的空白。半年后,“支小宝”又率先搭上大模型的快车,从检索式AI 1.0进化到生成式AI 2.0。生成式AI对蚂蚁财富业务的赋能,让4300万普通投资者抢先拥有了自己的“私人理财专家”。

2024年,蚂蚁集团金融行业大模型负责人王晓航表示:“销售、服务、风险管理、投研、理赔等,金融业务链条上每一个关键职能,都值得用大模型技术重做一次。”在金融领域,蚂蚁集团加大了生成式AI技术与业务的融合,并以行业大模型作为认知交互的中枢,调用金融领域的专业知识和蚂蚁集团体系内的专业工具及服务,为个人级、产业级消费者提供强大应用支撑。

在B端,蚂蚁集团首次推出了面向产业的金融版Copilot——支小助1.0,包含服务专家版、投研专家版、理赔专家版、保险研判专家版等6个版本。服务专家版支小助1.0可以为销售提供个性化的话术培训;投研专家版支小助1.0对每日事件实现媲美人类专家平均水平的主观分析与决策,将事件解读效率从每周10篇提升到每日400篇,可以帮助用户生成金融工程代码;理赔专家版支小助1.0依靠思维链及多模态能力,大幅提升了核赔自动化水平,能够将复杂单据的整案提取准确率由80%提升到98%,让门诊险理赔和30%以上的住院医疗险理赔能够实现完全自动化;保险研判专家版支小助1.0的研判观点提取不仅比主流通用模型优秀,甚至超过专家平均水平。

在C端,蚂蚁集团相继推出了智能金融助理支小宝1.0、2.0版本,并在支小宝转型为智能生活服务管家后,推出金融行业的最新版AI金融管家“蚂小财”。目前,蚂小财已通过支付宝App和蚂蚁财富App实现全量对外——在支付宝App端,用户可以搜索“蚂小财”,点击搜索结果即进入AI问答页面;同时,蚂蚁财富全新App搭载了蚂小财Pro版本进行上线灰测,这是国内首个实现AI原生体验的理财类App。据了解,蚂小财主要可以实现理财投教、资产分析、收益分析、风险提示、理财规划、市场动态、行为评估七大类功能,其所提供的服务均由合作的持牌机构提供专业性支持。目前,蚂小财连接了基金公司、券商、财经媒体等200多家专业机构,以及超1.5万位专业财经创作者,提供专业服务和内容。


支付宝搜索“蚂小财”页面、智能理财助理&智能保险助理问答页面


截至2024年8月,AI金融管家蚂小财的月度活跃用户数达到了7000万人,其中有45%来自三线及以下城市。搭载了AI金融管家的新版蚂蚁财富App可以提供私人定制感更强的理财体验,例如用户可以在蚂蚁财富App首页,根据需求将自己最关注的行业板块、基金经理等添加到“理财小简报”,保持追踪和解读。

生成式AI助力生活,便利用户多元需求

如果说在金融行业的生成式AI应用利用了蚂蚁集团的金融基因优势,那么在赋能生活层面,蚂蚁集团则巧妙借助了支付宝App的强生态流量优势。

专属服务,匹配千面生活。支付宝智能生活助理“支小宝”是基于蚂蚁集团自研的百灵大模型研发的一款全新生活办事AI产品,不仅“有脑有嘴能对话”,还“有手有脚能办事”。目前,支小宝可以提供出行、健康、政务等领域的超8000项数字生活服务。

支小宝有两个应用渠道,一个是支付宝平台内的小程序形式,一个是服务型独立AI App形式,二者在页面和功能布局上均相同,包括三个核心板块:第一是“此刻”,围绕用户生活的交通出行、快递寄取、健康管理、政务办事等方面,联动了支付宝生态内部丰富多元的场景应用,在“此刻”板块,用户可以看到AI提醒你去取快递、提醒当前交通路线、查看外卖进度等。另外,具备场景感知系统的“支小宝”在经过用户授权后,可以记住个人的通勤方式、餐饮口味、旅游偏好等,为用户生活提供了“管家式、一站化”的便利服务;第二是“对话”,支小宝通过用户的语音和文本指令完成人机对话式交互,输出各种专业知识及专业服务;第三是“智能体”,在智能体板块,支付宝通过智能体协作平台与各个领域的公司、机构、商圈、专家名人等合作,打造专业智能体。例如,2024年9月,安徽黄山风景区宣布携手支付宝,打造国内首个“全程AI伴游”景区。当外地游客抵达黄山后,打开“支小宝”就能快速进入黄山空间智能体,用户可以通过与智能体交互获得AI导游、门票预订、餐饮推荐等智慧服务。


支小宝此刻&对话&发现页面


支付宝基于蚂蚁百灵大模型推出的支小宝,是国内首个服务型AI独立App。“更专业的问题,可以让更专业的AI智能体解决。”支小宝产品负责人王翼飞表示。支小宝的落地,使更聪明的“你说我办”成为现实,以AI生活助理的角色服务千家万户。

生成式AI赋能医疗,提供智能体解决方案

在生活服务中,一个尤其重要的板块是解决老百姓寻医问诊的问题。因而,面对消费者潜在的庞大需求,蚂蚁集团也率先在支付宝医疗服务中布局了生成式AI,用技术赋能医疗。

2023年11月,浙江卫健委应用支付宝开放的“AI就医助理”解决方案,依托大模型、数字人技术,打造了全国首个数字健康人“安诊儿”,给浙江居民提供云陪诊、健康咨询等服务;上海市第一人民医院上线了上海首个可语音交互的“数字陪诊师”,并在业内首创了生成式电子病历,将繁杂的文书工作从原本的10分钟缩减到了15秒。在学界方面,北京大学医学部、上海交通大学医学院附属仁济医院、复旦大学附属肿瘤医院等高校及机构加盟了支付宝发起的“AI医疗共建计划”,共同探索大模型应用及各类专科模型创新研发。

2024年7月发布的支付宝医疗大模型依靠大模型基座能力和生成式AI技术,提供了数字人、AI Agent平台、AI行业解决方案等产品,让用户在支付宝看病就医更加便捷,整体上提高了支付宝医疗业务的实用性和易用性。

在行业大模型的基底上,2024年9月,蚂蚁集团在支付宝平台上线了“AI健康管家”,可提供找医生、读报告、陪看诊、问医保、管健康等30多项AI健康服务,涵盖日常看病就医、家庭健康管理所需。首先,“AI健康管家”可以提供包括毛发检测、药盒识别、抑郁自测、体重管理等在内的日常健康管理功能;其次,“AI健康管家”引进了超20家专业医疗机构、专科、医生智能体入驻,包含浙江省卫生健康委、上海仁济医院泌尿外科、血管外科医生张韬等;最后,支付宝推出了专业医疗健康智能体协作平台,可支持医疗大模型免费调用,并开放配套算力及数据安全解决方案,以降低机构开发和运营成本。

综上所述,在行业落地应用层面,蚂蚁集团目前聚焦金融、医疗、生活服务三大领域,主要利用专业智能体,进行了产业级应用实践。在金融领域推出AI金融管家——蚂小财、支小助系列产品;在医疗领域推出AI健康管家和专业医疗健康智能体协作平台等;在生活服务领域则是牢牢把握住了支付宝的生活服务体系优势,打造了AI生活助理支小宝。支付宝AI新产品的接连落地,正标志着蚂蚁集团“AI First”战略的全面提速。

4


结语

从阿里系独立的蚂蚁集团,扎根金融土壤,从互联网深耕生成式AI技术,并依靠技术驱动探索出了一条新路:以行业大模型为认知和交互的中枢,调用领域知识和专业服务,为消费者提供产业级的应用支撑。在新一轮AI变革中,蚂蚁集团通过行业大模型释放了其技术优势,在金融、医疗、政务、出行等超500个场景领域中,服务了亿级用户。

从生成式AI发展浪潮来看,大模型从“拼参数”走向“拼应用”已是必由之路,期待未来蚂蚁集团会交出更加精彩的答卷。


更多深度好文


点击下方文章标题,立即阅读最新行业热点、业界趋势

视点 | 大模型之三观

视点 | 中国式大模型,产业实用主义

案例 | 华为云盘古大模型:走难而正确的道路

案例 | 百度生成式AI:头雁早飞鸣秋丰

案例 | 科大讯飞:大模型商业化应用元年的下一步

案例 | 字节跳动:AI 落地,实力派玩家入局



购买最新杂志


长按下方卡片识别二维码,购买最新杂志



关于我们


本文编辑:王佳梁

本微信号由中国传媒大学广告学院《媒介》杂志独家运营

版权所有,违者必究


点击下方卡片,关注公众号,第一时间获得最新深度资讯

媒介杂志
整合传播传统及新媒介资讯,分析行业热点事件,探索业界趋势
 最新文章