AI大模型如何在各行业跑通业务闭环？

科技 2024-05-20 14:21 辽宁

嘉宾｜高磊、平野，贾志鹏

策划｜薛梁

审校｜何逸灿

诸多新技术范式的出现正在重塑 AI 大模型应用的落地路径，大模型在推动企业向全面数智化转型的同时，也在对以往的 AI 应用开发与运维流程产生深远影响。当大模型爆红之初惊喜又兴奋的心情平复下来时，AI 大模型落地行业场景时的诸多挑战逐一浮出水面。

各行各业如何面对大模型应用探索中的新挑战？对于金融行业等数据密集、对产出结果精确度有很高要求的产业，或是要求严谨专业的物流与供应链领域而言，大模型应用如何平稳走进业务场景？下一步，AI 大模型该如何结合行业特点、满足行业要求，向行业垂直领域大模型发展？

在日前的《超级连麦. 数智大脑》x ArchSummit 直播节目上，顺丰科技运筹优化算法总工程师高磊、天弘基金人工智能部负责人平野、Fabarta 高级技术专家贾志鹏就这些问题展开了深度探讨。

以下内容根据对话整理，篇幅有删减，点击「阅读原文」可观看直播回放

大模型应用现状简介

高磊：平野老师曾经在支付宝第五代智能风控引擎 Alpharisk 的开发中发挥了重要作用，能否分享一些 AI 和大模型在智能风控领域的技术创新和实践经验？目前，天弘基金在大模型领域又有哪些探索？

平野： 在支付宝支付风控部门任职期间，我参与了风控引擎架构的转型建设。最初，风控引擎的设计主要依赖于策略，当时大约 70% 以上的风险防控措施都是基于策略的。制定策略时先由专业分析师根据具体场景构建特征，再通过这些特征组合成策略进行风险管理。

随着时间的推移，支付宝开始探索以 AI 模型替代人工的策略，在 2017 年至 2019 年这一早期阶段，尽管全球成功的 AI 风控案例并不多，我们仍坚持在 AI 风控领域不断探索和创新。风控引擎架构从传统的策略开始，逐渐过渡到一些机器学习模型，最终逐步引入了更高级的技术，如图神经网络和深度神经网络。我们还设计了高性能的分布式支付决策链路，显著提升了风控效率。

在 AI 应用方面，我们进行了多项独特创新，包括基于 MOE 的多任务学习框架，并针对具体场景进行了创新。此外，我们还开发了图算法和可信网络等技术，这些技术在支付宝的风险防控中发挥了重要作用。

Alpharisk 作为支付宝风控引擎的核心组件，经过数次迭代，已发展至第五代，其智能化水平显著提升。从风险感知、决策到结果演化，这一系列决策过程现在主要都由模型自动完成。

高磊：阿里巴巴开发的大模型通义千问非常强大，支付宝在这方面是否有过合作？

平野： 在天弘基金大模型项目进行的过程中，我们曾经考虑过与第三方厂商合作，或者直接调用一些行业领先的大模型 API 来实现我们的目标。然而，我们很快意识到，金融业务场景对数据的准确性和专业性有着极高的要求。这一行业特点使我们不得不面临两点问题：

首先，现有通用大模型，包括去年早期发布的 ChatGPT 3.5，它们在数据实质内容方面的完善程度并没有达到我们预期；
其次，为使大模型在特定场景下的功能更智能化，就要求它能深入理解我们的业务场景，并专门学习不同的业务目标。但目前的通用大模型只能提供泛化的回答，并不能提供精准和实质性的内容。

基于这些考虑，我们决定主要通过自主研发来完成大模型项目，以更好地满足我们的业务需求。

高磊：贾老师在 Fabarta 担任高级技术专家，曾在 IBM、阿里云、HSBC 等公司从事金融、制造和汽车等行业的业务解决方案咨询与实施工作，能不能从您的角度介绍一下，大模型技术在这些不同领域的应用现状，主要能解决哪些业务问题？不同行业之间存在哪些独特挑战？

贾志鹏： 在公司成立之后，我们为多家企业提供了解决方案服务。这些服务包括针对不同行业设计定制化的解决方案，如金融、制造和医疗等行业。在这一过程中，我们注意到不同企业对大型 AI 模型（大模型）抱有多种期待。根据我们的经验，可以将这些期待大致分为以下三类。

现有系统优化：一些企业在大模型出现之前已经在运营或建设自己的系统，如文档管理、知识库和知识图谱等。这些企业希望通过大模型技术来丰富和优化现有系统，无论是优化数据接入还是提升最终产出。
生成式能力应用：大模型具有强大的生成式能力，企业希望探索这些能力在特定场景下的应用。例如，在前期构建知识库后，企业可能想要实现企业内部文档的问答系统，挖掘现有文档价值、解析问题并提供答案。此外，企业还希望通过大模型自然语言表达来实现自动发掘企业内数据，如报表和数据，这在 BI（商业智能）场景中尤为重要。
智能决策探索：近期业界在探索如何通过大模型实现智能决策，这涉及到使用 AI Agent 技术将不同的业务场景与大模型、甚至企业原有的小模型结合起来，共同解决特定问题，以实现智能决策。

高磊： 我在顺丰集团负责智慧供应链的建设工作。在公司内部，我们正在探索大模型技术在物流和供应链领域的应用。我们正在构建基于开源模型的“丰语”大模型，该模型专注于物流供应链领域的专业知识。依托此模型，我们尝试了多种应用，主要分为三大领域：

售前售后服务：在售前，我们尝试为快递员配备智能助手，帮助他们即时回答客户的收寄物品问题，而不必依赖个人经验或咨询同事；在售后，我们将大模型技术应用于智能客服系统，自动生成对话摘要，减轻客服人员的工作量，并利用大模型进行服务质检和客户声音洞察，帮助响应客户共性问题并提高服务规范性。
运营知识管理：我们尝试使用大模型技术自动从官方网站抽取国际通关的标准信息，并将其结构化，以便管理和应用。此外，我们还利用大模型优化快递下单时托寄物分类和描述的流程，以应对物品种类繁多带来的挑战。
BI 和智慧办公：在 BI 方面，我们为业务提供分析助手，帮助客户洞察和分析供应链表现、有无异常和根本原因，并提出优化建议；在智慧办公场景中，我们正在构建企业内部知识中台，来回答人力资源、财务、IT 等方面的问题，并在内部即时通讯系统中集成大模型，自动生成会议纪要和聊天摘要等。

大模型进入各行各业核心业务，难在何处

高磊：金融行业对前沿技术的接纳度是比较高的，不仅场景丰富、数据丰富，并且技术基础也较为完善，技术投入能力较好。根据两位的观察，目前大模型在金融行业的落地进展如何？能够满足最开始业界的预期吗？其中的阻碍和挑战主要来自哪些层面？

贾志鹏： 目前在金融行业中，将图智能技术与大模型结合的应用非常广泛。金融业务的复杂性导致交付过程中会涉及多个方面，包括风险控制、合规性、营销以及企业知识库和运维场景。尽管这些场景可以被统称为金融行业，但在不同场景下的具体需求有所不同。

对于风险控制，支付宝的风控手段如 Alpharisk，已经非常成熟。我们目前的重点是利用新技术，如图智能技术等，结合大模型，以更深层次、更多样化的手段来进一步完善风控体系。例如，在风控领域，除了传统的风险阻断措施外，还需要向客户提供合理的解释，这就需要模型的输出结果具有权威性，并且能够被把握和解释。

在合规性方面，随着金融监管的加强，金融机构需要遵守国家规定（外规）和内部规定（内规）。这要求我们将这些规定融合，并从中提取关键知识点。同时，还需处理包括司法判决、行政处罚在内的文档，并关联提取这些数据。这涉及到整合包括文本数据、企业内部交易数据和客户数据等多元异构数据的问题，是当前金融行业面临的重大挑战。

平野： 金融行业在大模型技术的发展和应用上，经历了几个明显的阶段。

初期兴奋阶段：随着 ChatGPT 的诞生，特别是在去年早期， ChatGPT 3.5 在短时间内迅速吸引了 2 亿用户，这让人们产生了 AI 能够解决一切问题的错觉。许多公司开始尝试将大型基础模型应用于金融行业的各种场景，如客服、合规风控、审核和用户体验等。
质疑阶段：在大模型技术落地应用的过程中，人们开始意识到并不是所有问题都能通过一个模型解决，特别是金融行业对合规性的要求非常高。大模型有时会生成不准确或误导性的信息，这对于用户和投资者而言是不可接受的。这导致了对大模型实际效用的质疑。
理智阶段：如今，金融行业对大模型的应用更为理智和审慎。技术发展开始向真正可落地的技术转向，比如基于大模型衍生出的新型架构，如 RAG（Retrieval-Augmented Generation）架构和 AI Agent 架构。这些架构除了能够增加模型回答的实时性，还让大模型更接近人类的思考方式，能够将复杂问题分解为多个子任务，并利用大模型的泛化能力进行准确的意图理解和回答。

除了传统的应用场景，金融行业还在探索如何将大模型应用于投资决策辅助等新领域。例如，Bloomberg（彭博）等公司发布的金融大模型，以及 FinChat、FinGPT 等，都在尝试利用大模型技术进行投资研究。天弘基金也在尝试将大模型应用于投资研究方向。

高磊：大模型在金融领域除了理解摘要方面的工作外，还有没有一些创新的想法？

平野： 在金融领域，大模型的应用经常被优先考虑用于客户服务和智能问答，这与 ChatGPT 以对话框形式出现时的自然联想相吻合。

在天弘基金，我们探索了一条不同的路径，特别是在投资研究方面。我们开发了一款名为 “弘小助” 的内部产品，专注于投研领域。弘小助的主要特色在于采用了 RAG 架构，进行实体化的检索。

在行业研究方面，我们进行了一项特别创新的工作，即将研究员的思维模式融入大模型中。通过 COT（Chain of Thought）这种思维模式，我们结合了研究员的思维方式和大模型的能力，创新了一项名为“COM”的技术。这个过程将“thought”转化为我们的“mind”，使我们能够将意图拆解为多个子意图，并进行更深层次的分析。例如，如果我们要了解今天光伏行业的投资机会，通用大模型可能会提供一个一般性的回答，这可能不是研究人员真正想要的深层信息。通过将研究思维整合进大模型，并进行创新性的工作，我们可以在一定程度上为研究人员提供辅助工作，帮助他们更深入地理解市场和投资机会。

高磊：请问平野老师，大模型来做投研，个人投资者有没有机会使用？或者是否能对其有所帮助？应该如何使用？

平野： 投资通常被视为一门艺术，而不仅仅是技术。尽管如此，随着人工智能的快速发展，越来越多原本需要人工完成的思考和分析工作，现在可以由机器来辅助完成。

从技术角度来看，大模型在投资中主要发挥辅助作用。它不会直接告诉投资者应该买入或卖出什么，因为这样的建议可能缺乏可信度。大模型的真正价值在于提供深入的行业分析、资金流向、市场行情、政策变化等信息，帮助投资者更好地理解投资环境。如果投资者对某个特定的投资标的或行业感兴趣，大模型可以提供该行业的现状、资金流向、市场行情等详细信息。对于基金产品，如 ETF，大模型可以帮助分析近期的市场异动，包括政策、资金和基本面的变化。此外，大模型还可以分析宏观层面的因素，如美联储的加息决策对投资的潜在影响。通过整合金融领域的数据库，大模型能够提供准确的数据支持，帮助投资者形成自己的投资逻辑链。例如，在光伏行业，大模型可以展示产业链上中下游企业的财务和经营状况，使投资者能够判断企业的优劣和发展前景。

尽管大模型可以提供数据、舆情、投资链路和财务分析等综合信息，并生成总结性摘要，但最终投资决策仍然需要人的参与。投资者应根据大模型提供的信息，结合自己的判断，做出正确概率较大的投资选择。

高磊：平野老师将在 ArchSummit 深圳大会上分享《AI Agent：超越文本，走向自主决策与交互》话题演讲。那在天弘基金的业务实践中，AI Agent 落地的场景包括哪些？在这个过程中面临的主要挑战是什么？您是如何解决这些挑战的？

平野： 与其他行业相比，金融行业对结果的可靠性和专业性要求极高。当前大模型存在的幻觉问题和知识过时问题，可以通过 AI Agent 技术有效规避。AI Agent 能够为大模型提供私有且可靠的知识注入，同时获取市场实时信息，如指数地图和每日行情等。在各个场景中，大模型被视为一个能够调动各种工具（tools）的智能体，更贴近人类的思考和行为模式，同时比人类更聪明高效。我们调研了多个金融行业业务场景中 AI Agent 技术的应用效果，包括投研投顾、风控营销、客服合规等。特别是在金融知识问答、研报知识解读、文章精读等场景中，AI Agent 技术显示出较大的潜力。此外在销售过程中，AI Agent 可以快速生成营销物料以抓住时机，对提高效率有显著帮助。

AI Agent 落地过程中面临的挑战：

低容错率：由于金融行业对时效性和准确率的高要求，模型推理过程必须非常清晰，以确保结果的有效性和可靠性。
合规监管要求：金融行业合规监管要求较高，导致许多公司更倾向于本地化部署模型，这增加了自研成本。
推理分析的高要求：金融行业对推理分析的要求超过其他行业，因为金融问题往往缺少标准答案，需要用模型进行事实性的推理，这要求技术向特定架构倾斜，并进行强化学习。
多模态理解：金融行业涉及多模态信息理解，如财务报表、图表、视频等，有效关联和分析这些信息很困难。

高磊：对于 AI Agent 技术，您提到了感知和决策的能力是至关重要的，您团队是如何利用深度学习、自然语言处理等技术来提升 AI Agent 的感知和决策能力的？

平野： 在 AI Agent 架构中，感知能力和决策制定构成了其核心。特别是在金融投资领域，市场信息的准确感知对于形成有效决策至关重要。投资经理在做出决策前，必须收集和消化包括研报、国际与国内市场状况、宏观经济、行业动态、公司情况及监管变化在内的大量信息。传统 AI 模型在处理此类复杂信息存在局限，而大模型的应用为解决这一问题提供了可能：它能够处理信息差异，帮助拆解和解决投资决策中的问题。

我们内部开发的 Copilot 工具，是一个基于自然语言处理技术的交互式数据查询工具，可以提升市场感知能力。该工具分为三个关键部分：首先，它需要理解并计算海量金融指标；其次，确认所采取的步骤是否正确；最后，根据不同用户角色的需求定制知识库，减少模型需要处理的指标范围。此外，通过 RAG 技术，模型不仅能召回所需的指标字段，还能根据用户的历史搜索习惯进行智能联想，从而提高查询的准确性。

在决策层面，将用户的自然语言描述转换为可执行的查询，需要模型对金融领域有深刻的理解。这包括基于基座模型进行预训练，输入大量金融数据和特定的金融指标，如收益率、Alpha、Beta 等，再训练模型理解这些指标及其应用场景。此外，通过指令对齐和利用相似查询案例的预训练，可以提升模型识别用户查询意图的精准度。在执行层面，大模型根据对场景的理解调用不同的指令，以适应不同场景的需求，从而提供更加精准的结果。

高磊：在多 Agent 系统的实际应用中，专家们是否有过将其落地到具体场景的经验？当涉及到跨企业间的 AI 应用交互时，有哪些重要的注意事项需要考虑？具体来说，应该留意哪些关键的事项以确保 AI 应用交互的有效性和安全性？

平野： 在天弘基金，我们已经将多 Agent 技术应用到实际场景中，尤其是在我们提到的“弘小助”产品中。这个产品需要处理来自不同方面的问题，比如某个 ETF 在特定行业的表现、当天股市的大盘情况、金融宏观层面的总体状况，甚至是更具体的投资模型问题，如 Fama-French 三因子模型的含义和应用。

这些问题不是单一场景下的通用问题，而是需要多角度分析的复杂问题。我们采用了多 Agent 技术，将其拆解为三个维度来处理。

发散性思维：针对抽象的金融问题，如光伏行业的投资时机，研究员需要从多个角度思考和收集信息。我们利用大模型的能力，结合研究员标注的专业图谱进行训练，模拟研究员的思维模式，进行多角度分析。
顺序性思维：对于需要逻辑性和时间顺序的任务，如写作，我们使用 Agent 技术规划整个写作蓝图，然后通过大模型生成基于召回信息的有序内容，确保逻辑性和连贯性。
抽象思维：针对具体且复杂的金融综合性问题，如在特定宏观经济条件下的政策影响，我们利用大模型对知识结构的压缩和对指令的全面理解，将复杂问题拆解为多个子问题再分别处理，最终整合出全面的回答。

多 Agent 技术的应用，不仅提升了我们处理问题的效率，并且通过模拟研究员的思维模式引导了整个分析过程，使我们能够更好地理解和回答复杂的金融问题。通过这种方式，我们能够将大模型的生成能力和传统模型的计算能力结合起来，解决供应链中的一些核心问题，如路径规划和销量预测，这些都是序列生成任务。尽管目前还存在一些挑战，但我们相信，随着技术的发展，大模型技术将在供应链决策中发挥越来越重要的作用。

贾志鹏： 我们公司在构建企业知识中台。作为一家研发公司，我们在内部经常会遇到需要确定谁对某个技术领域更熟悉的问题。例如，当我们想要了解谁对引擎的存储层最了解时，需要从多个维度进行评估。首先，我们会查看代码提交记录，通过 Git 平台的 API 接入来分析谁在相关领域的代码提交量最多。其次，我们会分析设计文档、分享材料和会议记录等文档资料，以确定谁在这些文档中的记录和贡献最多。此外，我们还会利用内部结构化数据来辅助评估。通过代码提交分析、文档解析和内部数据查询这三个渠道，我们能综合召回结果，并形成一个全面的回答。在回答的过程中，我们不仅提供答案，还强调可追溯性，即清晰展示得出这个答案的过程和依据。例如，如果我们得出结论认为某位同事对引擎最熟悉，我们会展示支持这一结论的证据，包括代码提交量、文档贡献以及组织架构中的相关信息等。这一过程确保了我们的回答不仅准确，而且具有很高的透明度和可信度。

高磊：志鹏老师的公司是做图智能技术的，在金融领域，您认为图智能技术的应用潜力体现在哪些方面？具体落地到企业的业务中，面临的最大挑战又是什么？您的团队是如何解决这些挑战的？

贾志鹏： 我们公司一直在积极推动图智能技术的实际应用落地。在讨论图技术时，人们通常会想到知识图谱或图神经网络。知识图谱是我们的一个应用领域，它之所以受到重视，是因为它包含了大量经过专家验证和精心运维的确定性知识。尽管知识图谱也有一定的运维成本，但在达到一定规模后，其价值是显而易见的。

但如何构建一个完整和完善的知识图谱 是一大挑战，它需要整合来自不同来源的数据，包括结构化数据库、文档提取以及专家经验等。大模型的出现为解决知识图谱构建中的一些基础问题提供了新的可能性，例如利用大模型辅助数据标注、实体提取和实体关系连接等。

除了知识图谱，图技术在其他应用场景中也展现出其潜力，如金融风控和合规领域。这些领域并不需要构建一个完整的知识图谱，而是需要实时生成交易图或关联图谱，以便业务人员能够通过可视化手段探索和分析数据模式。在贷款审查或交易链路探查过程中，图技术可以帮助揭示循环担保、家族式交易或集团内部隐藏关系等问题。这些模式一旦被业务专家通过图技术探索出来，就可以通过技术手段复用，并推广到更全面的数据样本中去发现类似问题。这引出了一个新的挑战：如何节省业务人员在发现问题后编写报告的时间。在反洗钱领域，银行或金融机构需要定期处理大量的排查名单，如何快速应用已发现的模式并生成总结报告是一个亟待解决的问题。

大模型结合图模式可以作为解决这一挑战的工具，帮助生成和加速报告生成过程。在营销领域，尽管我们不是指大规模的互联网或电商营销，银行内部的金融产品、信用卡产品推广，以及银行 APP 流量和商户推荐等，都可以通过构建图谱并发现关联关系来进行更有效的营销推广。在这个过程中，图神经网络可以发挥作用，虽然它需要大量数据和算力来实现最佳效果。

在图智能技术应用过程中，需要综合考虑不同场景下的因素，这些因素将决定最终的架构决策。数据如何进入图谱是一个关键问题，特别是对于中小企业如何应用大模型能力这一问题，我们非常感兴趣，并一直在实践中帮助客户构建这样的能力。

此外在数据准备阶段，企业需要处理多源数据，包括结构化和非结构化数据，并解决数据的关联和组织问题。我们目前正在进行的“元数据知识化”项目，旨在通过大模型辅助生成标注，并通过图的方式组织数据，从而为后续的数据分析和问答提供清晰的数据关系和可追溯性。这是我们在图智能技术应用中的一个重点投入方向。

高磊：不同行业图谱的构建和生成有哪些共性？

贾志鹏： 根据个人经验，在金融、制造、医疗这三个方向上，图谱的构建和应用具有一定的共性。首先，知识图谱因其确定性知识的特性，与特定领域紧密相关。在提取知识构建图谱的过程中，我们不依赖通用的方法，而是采用技术框架来组织数据，关键是如何快速有效地将数据整合入图，形成有用的图谱。

目前，我们在数据整合方面积累了几个方向的经验。我们将数据分为结构化、半结构化，并采取自动和半自动的方式入图。半自动入图涉及使用大模型技术预先处理数据，随后采取人工审核和反馈循环进行修正。自动入图则依赖信息化过程中产生的结构化数据，如交易数据或供应链中的供应商信息，这些可以直接映射入图。

除了技术手段，图谱构建还需要理论支持和方法论指导。在实施过程中，我们强调业务目标的中心地位，避免一开始就构建一个过于庞大的图谱。以风控为例，我们会筛选与风控业务相关的信息设计图谱的 schema，并裁剪现有数据以形成有效的图谱。如果基础图谱设计得既完善又合理，并且业务方能够清晰理解图谱所表达的内容，那么在使用过程中就能够带来显著的效果。

高磊：志鹏老师，在 ArchSummit 深圳的演讲中，会提到大模型与图智能技术结合的三种方式，可以先大致给大家介绍一下吗？您认为其中在金融领域的应用前景最广阔的是哪一种方式？为什么？

贾志鹏： 这一课题的准备工作始于 4 月份，当时我们提出了三种结合方式，前两种较为常见：

第一种是通过大模型辅助图谱构建，利用大模型从非结构化数据中提取知识，并将其整合到图谱中，随后通过人工审核完成图谱的构建。
第二种是大模型增强的图谱使用，例如在风控领域，通过图模式发现数据后，利用大模型生成用户报告。
第三种是图增强概念。近一两周，我们注意到微软等公司也发表了相关研究文章，提出了图增强 GraphRAG 等概念。我们认为，知识图谱的优势在于承载确定性知识，若在大模型问答过程中能够结合图谱进行知识召回，那么所召回的知识将更具权威性和业务价值。通过这种方式，可以提高回答的准确性。

我们认为这三种方式相辅相成，不仅在图谱构建阶段利用大模型，在图谱使用过程中也通过大模型增强其效能，而在大模型召回结果时，图谱起到了关键作用。我们预见，大模型与图智能技术结合后的应用前景广阔，尤其是在决策智能方面。结合图谱的确定性知识与大模型的生成式知识，可以对企业现有的多模态数据进行加工沉淀，形成具有生成能力和可解释性的决策支持。 以金融大模型投资为例，个人投资者可以在不同阶段获得理解和辅助，最终做出决策。

我们希望通过图的方式将决策所需的知识串联起来，构建一个确定性的图谱，为用户提供确定性的答案。同时，通过关联方式呈现召回逻辑和回答逻辑，让用户清晰了解决策背后的逻辑，这一逻辑是结合了图谱确定性先验知识的。

高磊： 事实上，大模型在金融、风控、营销等多个领域，智能制造背景下的大模型和 AI 技术展现出巨大的应用潜力。例如，在药物研发领域，DeepMind 公司近期在《自然》杂志上发表的研究成果 AlphaFold3，展示了 AI 准确预测蛋白质空间结构及其与化学物质相互作用的能力，这对药物设计具有重大意义，显著降低了实验和筛选候选药物的成本。

众多国内外创业公司正在开发 AI 辅助的工业设计和服装设计软件或系统。谷歌也曾发表使用强化学习辅助芯片设计的研究。这些新技术，包括大模型和 AI 技术，在智能制造 的设计和研发阶段提供显著帮助。在生产阶段，AI 技术，包括大模型，在生产计划制定、排程排产、物流优化、工艺参数智能调优、AR/VR 技术应用以及计算机视觉辅助质检等方面，都有很大的应用前景和空间。

在即将到来 ArchSummit 深圳大会上，AI 助力工业和制造智能化专题论坛将邀请来自美的、心智优化、生活科技、红海科技、腾讯云等企业的专家分享 AI 在工业制造场景下的最新应用案例和最佳实践。论坛将探讨如何有效利用 AI 技术推动制造业智能化转型，以及如何克服 AI 应用过程中的问题和挑战。

在物流和供应链领域，AI 模型应用面临独特挑战。尽管大模型具备强大的通用能力，如海量知识、规划推理能力，甚至编写代码能力，但它们也有局限性，例如易产生幻觉、不擅长精确数值计算，以及对深入业务理解的不足。这些问题同样困扰着大模型在供应链领域的应用。目前，我们在供应链领域的大模型应用探索主要集中在售前、售后和智能办公等周边领域。

供应链核心领域的智能优化和决策是非常专业和严谨的，任何不准确的信息或计算错误都可能对业务造成重大影响。智能决策领域的问题，如网络规划和路径优化，通常是 NP-Hard 问题，需要大量计算，且输入输出是非文字和非图片的结构化数据。因此，大模型在供应链智能决策领域目前难以发挥作用，也不是其擅长的领域。 目前可以通过 Agent 技术结合传统模型，将传统模型和技术封装为工具，由大模型负责人机交互界面和高层控制规划，从而在传统技术和大模型技术之间架起桥梁。

此外，供应链领域的许多决策任务本质上是序列生成任务，如旅行商问题可以抽象为序列生成问题。因此，可以利用大模型底层技术，如 Transformer 架构，来解决这些问题。尽管目前还存在学术研究中的问题简化、距离计算的欧式空间问题、实际问题规模的扩大等挑战，但随着研究的深入，预期未来大模型技术能够在供应链核心决策问题上实现突破，并在行业中得到普及和应用。顺丰也在持续关注这一领域，并尝试解决这些问题，期望未来能分享相关进展。

高磊：中小规模的公司想做顺丰现在实现了的一些场景，大概要花费多少投入？需要组建什么规模的团队？

高磊： 在讨论大模型应用的投资问题时，需要考虑几个关键因素，包括赛道、行业特性、专业数据的需求以及算力和数据的投入。

行业特性与场景需求：首先，投资的规模和方向取决于所处的行业和具体应用场景。如果行业有大量专业知识和特定数据需求，而这些是公开模型无法处理的，那么可能需要更多的投资来进行模型的微调（fine-tuning）、使用自有数据进行训练。
算力与数据投资：在金融等数据密集型行业，算力和数据通常是投资的重头。如果需要自行微调模型，这将涉及到基建方面的较大投资。
人才与研发投入：如果不需要对模型进行微调，或者不需要通过复杂的技术嵌入行业知识，研发人员的投入可能并不会特别大。在这种情况下，少数算法工程师可能就足以推动项目前进。
定制化需求与投资规模：如果行业缺乏公开的大模型，或现有技术无法满足业务需求，需要自行收集数据并进行模型微调，那么所需投入将会显著增加。

趋势与展望：各行业大模型应用将走向何方

高磊：在基金行业，如果上述提到的来自技术、业务、组织、人才等方面的挑战可以解决，平野老师，您认为 AI 和大模型技术还有哪些新的可能性和潜力？

平野： 在未来，大模型在解决业务问题上将更倾向于深入各个垂直领域，针对特定问题提供解决方案。随着技术的不断进步，大模型的应用将从单一的文本处理方式扩展到更多模态的解决方式，比如结合视觉、语音等，这将推动更多复杂场景和问题的解决。

将来在金融行业，大模型能够极大地提高研究效率。例如，以往一个研究员可能一天只能阅读十篇左右的研究报告，而未来大模型可以快速提炼关键信息，使研究员在短时间内阅读上百篇研报，并通过辅助工具进行深入分析和个性化阅读，这与整个行业发展趋势是相契合的。

随着经济的崛起，金融行业的体量将不断扩大。以基金经理为例，当管理的资产规模从一亿增长到十亿、百亿甚至千亿时，需要关注的公司数量也会成倍增加。在这种情况下，大模型能够帮助基金经理更高效地处理信息，从而在决策过程中做出更精准的选择。大模型不仅在提高工作效率方面发挥作用，还能提升决策的专业程度，为使用者提供准确和有效的信息。在金融行业，大模型的应用将主要集中在提高研究效率和决策精准度上。

展望其他行业，我认为大模型将逐渐承担起重复性和基础性的推理工作，而人类工作者将更多地从事架构层面和决策层面的最终决策。这样的分工将使整体工作流程更加高效，同时也能够达到比以往更令人满意的结果。

高磊：志鹏老师，您对 AI 和大模型技术在金融领域的发展前景有何展望？未来，您认为 AI 技术将如何提升金融行业的智能化水平和服务能力？

贾志鹏： 我非常认同平野老师提到的两个关键词：多模态和决策智能。我们公司在内部对未来大模型应用落地的展望也集中在这两个方向。多模态是指结合多种信息形式，如文本、图像、声音等，而决策智能则涉及到利用 AI 进行复杂决策的过程。

平野老师也提到了通过多个 Agent 联合来实现决策智能。随着大模型和多模态智能在企业中的广泛应用，我们预见这将加速企业内部数据布局的整理工作。金融领域的数据极为复杂，不仅包括各种指标平台和不同的指标口径，还涉及银行、经纪人持有的数据以及行业和国家标准数据。要有效地支持大模型并整理多模态数据以实现准确决策，需要确保数据的准确性和就绪性。这意味着企业可能需要整合其所有数据，探索不同数据间的关联关系，并进一步挖掘和整合数据。包括元数据在内的不同数据类型需要被整合和关联起来，以便它们能够与大模型有效地结合，再通过多个 Agent 的学习和协作，承担完整的决策职能。大模型的应用可能会催生或加速企业数据整合的过程，推动企业更高效地利用其数据资源，以实现更精准的决策。

高磊： 除了金融领域，我还想提一下 AI 大模型在 智能供应链体系建设 方面的应用前景。AI 大模型与智慧供应链的融合，是一个充满潜力和激动人心的领域，有许多令人期待的应用场景和可能性。

第一，AI 辅助的产品设计和研发，如 AlphaFold3 在医药研发领域的应用，以及 AI 在芯片设计和工业设计中的辅助作用，预示着这类技术将越来越普及。

第二，随着 AI 技术的发展，例如特斯拉最近发布的擎天柱机器人二代，以及李飞飞教授新成立的聚焦空间智能的公司，集成智能的机器人将能够完成更多复杂任务。在生产制造和供应链领域，当这些具备大模型加持的具身智能机器人的能力达到一定水平，许多危险和重复性劳动完全可以由它们来承担。

第三，Agent 技术的应用将越来越广泛，未来可能逐渐替代一些 B 端软件。在公司中，无论是一线工作人员还是管理人员，都可能配备多个 Agent 助理，通过日常交流完成大量工作。

第四，目前大模型在供应链智能决策核心的应用还处于外围阶段。但我相信，未来大模型将直接作用于智能决策的核心领域，将会有更多专业模型涌现出来。这些模型不再是通用的行业大模型，而是具备特定行业专精知识的模型，如专注于路径规划或销量预测的专业大模型。它们的应用形式可能不再局限于文本或图片等信息载体，而是直接输出对应的决策信息以支持业务需求。

这些是我对 AI 大模型在未来，特别是在供应链和制造领域应用场景的一些展望和设想。随着技术的不断进步，我们有理由期待这些设想将逐步变为现实，为行业带来更多创新和变革。

高磊：大模型可以替代金融分析师生成以行研报告吗？或者竞品技术分析有哪些方面的配置要求？

贾志鹏： 我认为这个问题可能与平野老师刚才介绍的平台报告相关。基于我的观察和经验，技术并不能完全替代人类，它只能无限逼近人类的能力和决策水平。 在某些方面，特别是在我们讨论的传导行业或 ToB 领域中，我们不能单一地从技术角度来衡量问题。实际上，管理因素在这些行业的落地应用中占据了重要地位。

平野： 分析师可以用大模型辅助撰写行业报告。我们认为大模型并不是要替代分析师，而是与之相辅相成，帮助他们更高效地完成任务。过去，编写一篇行业研究报告可能需要数小时、数周、甚至一个月的调研时间。如今在大模型的帮助下，这一过程的用时会大大缩短，甚至在一天之内就能完成。我们已经在这方面进行了实践，并开发了相关的落地产品。

至于观众提到的竞品技术分析，我认为这实际上是一种情报分析。金融领域的信息通常并不完全透明，不同机构对信息的处理方式各异；同时金融业是一个信息量爆炸的行业，对信息的实时性和准确性要求很高。在大模型的支持下，分析师可以在短时间内迅速发现市场热点，这些热点很可能也是其他公司关注的焦点。利用 BI 工具的数据处理能力，结合大模型的推理生成能力，可以部分替代金融分析师的工作，甚至一个经过训练的大模型可以处理多个金融分析师汇总的信息。

如果要考虑配置要求，我认为可能需要在市面上已有的模型基础上进行个性化训练，这可能涉及一定的硬件资源投入，如训练用的计算卡，同时也需要相应的人才来进行预训练和模型调优等工作。

嘉宾介绍

高磊，顺丰科技运筹优化算法总工程师，拥有 10 年 + 机器学习与运筹优化算法经验，研究方向为运筹优化、强化学习等。2016 年加入顺丰，现任顺丰科技运筹优化算法总工程师，曾主导顺丰集团内部多个数智化项目的研发与落地工作，涉及领域包括业务量预测、陆运干支线规划与调度、航空规划与调度、运力规划、场站选址、物资调拨等。

目前主要负责集团智慧供应链体系建设相关工作。期间带领团队获得十余项发明专利，中物联物流技术创新奖、CCF BDCI 一等奖、最具商业价值奖，运筹帷幄年度行业实践奖与学术应用奖等荣誉。

平野，天弘基金人工智能部负责人，毕业于英国曼彻斯特大学计算机系。天弘基金算法团队负责人，负责营销、风控和投资智能化业务领域。天弘金融大模型负责人。曾就职于百度、蚂蚁金服等，是支付宝第五代智能风控引擎 Alpharisk 主要开发者之一，该项目获 2019 年浙江省科技进步一等奖。百度昊天镜业务风控模型团队总负责人。

贾志鹏，Fabarta 高级技术专家，曾先后就职于 IBM、阿里云、HSBC，专注于金融、制造和汽车等行业的业务解决方案咨询与实施工作。

今日好文推荐

架构师会被 AI 秒了吗？

“数据虚拟化之父”解密数据编织，大模型时代的数据生产力就靠它了

Shopee海量商品系统的治理挑战和应对之策

蜂窝架构：一种云端高可用性架构

活动推荐

本届 ArchSummit 会议上，我们邀请了 CNCF、顺丰集团、阿里、腾讯、百度等企业的专家来演讲。会议上还设置了大模型应用、架构升级、智算平台、AI 编程、成本优化等专题和话题内容。如您感兴趣，可点击「阅读原文」查看更多详情。目前会议进入 9 折购票阶段，可以联系票务经理 17310043226 , 锁定最新优惠。

InfoQ 架构头条

InfoQ旗下，专注于软件开发基础技术的专业公众号。在这里，你可以看到涵盖架构、云计算、运维、数据库、安全、编程语言、程序员周边等全领域的干货内容。帮助广大开发者更好地把握技术脉搏，找准技术方向，了解前沿技术落地实践。