北航李伯虎院士团队 | 工业大模型:体系架构、关键技术与典型应用
文摘
科技
2024-10-14 12:42
北京
文章下载
任磊, 王海腾, 董家宝, 贾子翟, 李世祥, 王宇清, 赖李媛君, 黄迪, 张霖, 吴文峻, 李伯虎. 工业大模型:体系架构、关键技术与典型应用. 中国科学:信息科学, 2024, doi: 10.1360/SSI-2024-0185
随着新一代人工智能的发展,大模型(如GPT-4o等)凭借大规模训练数据、网络参数和算力涌现出强大的生成能力、泛化能力和自然交互能力,展现出改变工业世界的巨大潜力。尽管大模型已在自然语言等多个领域取得突破性进展,但其在工业应用中的探索仍处于初级阶段,当前工业大模型的系统性研究仍属空白。工业应用中特有的异质数据模态、复杂多样的专业化场景、长流程的关联性决策、以及对于可信性实时性的高要求,使得通用大模型无法直接用于解决复杂的工业问题,亟需开展全新的工业大模型基础理论和关键技术研究。本文系统地探讨了工业大模型的挑战问题、概念内涵、体系架构、构建方法、关键技术与典型应用。从五个挑战问题的分析出发,提出了工业大模型的全新定义和体系架构;同时,提出了工业大模型的四阶段构建方法,阐述了工业大模型核心关键技术;然后,基于所提出的工业大模型六种核心应用能力,探讨了面向产品全生命周期的工业大模型典型应用场景,并给出了“基石”工业大模型原型系统在生成式人工智能方面的应用实例;最后,探讨和展望了工业大模型未来的研究方向和开放性问题。本文将为工业大模型这一全新研究方向的开辟与发展,提供基础理论、关键技术和行业应用的全面指导。工业大模型的构建主要包括以下4个阶段:工业数据制备,工业基座模型训练,工业任务/行业模型适配,工业场景交互应用,如图2所示。与通用大模型不同,工业大模型面向工业应用的需求,在其独特的架构和训练方法的支持下,形成6种核心应用能力,包括智能问答、场景认知、过程决策、终端控制、内容生成和科学发现。工业大模型贯穿产品全生命周期、围绕六项核心应用能力的典型应用场景。工业大模型在实际工业生产流程中可以将工业智能体作为载体之一,与工业场景中所涉及的人员与工业赛博物理系统进行交互完成特定任务。