大数据产业创新服务媒体
——聚焦数据 · 改变商业
在数字经济时代,供应链领域的核心决策能力正越来越多地依赖于数据驱动的方法。数据要素作为继土地、劳动力、资本、技术之后的第五大生产要素,在供应链管理中的应用日益凸显,贯穿于供应链的各个环节。
京东物流作为行业的先行者,一线业务人员在日常工作中产生的大量数据,是数据要素应用的宝贵资源。为了解决数据生产与消费之间固有的准确性和一致性矛盾,本方案将大型语言模型融入数据分析,实现快速响应和灵活性、有效性,减少对传统人工操作的依赖,并显著提升一线业务人员的决策质量和效率。
该案例不仅致力于优化供应链管理,还能够通过数据的协同、复用和融合创新,发挥乘数效应,提升效率、释放价值和创新发展。
时间周期:
项目开始时间:2024年1月
中间重要时间节点:2024年2月(上线)
项目完结时间:持续应用推广中
在当前经济新常态的背景下,企业对数据驱动决策的能力需求日益增长。过去十余年间,随着信息化和数字化建设的不断推进,企业积累了庞大的数据资产,但目前缺乏对数据资产的有效利用和管理。
此外,数据的生产者与消费者之间存在明显的隔阂,数据壁垒严重阻碍了数据资源的流通共享,这不仅影响了决策的及时性和准确性,也限制了企业的高效运作和协同发展。业务团队面临着多样化的分析需求,而传统的中心化数据服务模式(如统一报表、看板、大屏等)无法满足这些个性化需求。随着数据看板数量的增加,用户在海量信息中寻找关键数据的难度也随之增大。
更为关键的是,现有的数据展示方式往往只能提供数据的表层信息,缺乏对数据背后波动和成因的深入分析。在这种情况下,业务人员不得不将数据导出,使用Excel等工具进行离线分析,这不仅造成了工作效率的低下,也增加了重复劳动。
京东物流期望能够打破数据要素流通壁垒,实现数据在企业内部的自由流动和共享,以便各部门能够充分利用数据资源,挖掘潜在的价值,提升整体的业务水平。并通过数据要素的流通应用,实现“以销定产”,反向推动数据团队发现哪些数据资源是限制的、哪些是急需补充的,从而有针对性地进行数据资产的管理和优化。
针对上述需求,京东物流构建了一套从数据治理到应用的解决方案,以取代传统的数据提取、指标计算和报表制作流程。
1、数据源分散
企业在数据管理上面临的首要问题是数据源分散。有数据应用需求的业务人员往往不清楚自己需要哪些数据表,这导致在数据获取上存在障碍。数据的分散性不仅增加了数据整合的难度,也影响了数据分析的效率和准确性。
2、数据获取流程复杂
业务人员需要通过多方面询问、访问多个系统才能获取所需数据,这一过程往往需要经过复杂的审批流程。这种繁琐的流程不仅降低了工作效率,也可能导致数据分析的延迟。
3、工具使用效率低
在数据应用方面,员工依赖于Excel等工具进行数据处理,这在面对大量数据时显得力不从心。
4、沟通成本高
员工在数据获取和分析过程中需要频繁地沟通确认需求、传递数据报表,这不仅增加了沟通成本,也可能导致信息传递的不准确。
本案例聚焦于大语言模型技术的应用突破,使数据分析更加迅捷灵活,从而摆脱对传统人工操作的依赖,提升企业决策水平和效率。
京东物流基于混合服务与分析处理(HSAP)框架,开发了UData智能数据服务分析一体化平台。在“AI for Data”理念指导下,实现了数据供需两端的创新变革。
在数据消费侧,形成了一套完整的数据分析智能体,以替代传统指标计算和报表制作;在数据供应侧,通过人工智能实现自动化的数据语义治理。同时,围绕指标体系构建完善的数据知识图谱,并通过元数据管理高效地开展数据治理和数据编织,实现了数据生产与消费视角的统一,推动了数据资产管理与分析的智能化应用。
数据分析智能体技术方案
数据资产语义治理
当前工业数据治理主要集中于数据资源的结构和质量评估,侧重减低存储和计算成本与提高产投比。然而,本案例提供了一个全新的视角,通过大语言模型的新技术,翻译和统一数据开发语言和数据分析语言,对数据内容进行语义分析,自动发现语义实体与关系,构建一个基于指标体系的企业数据知识全景图
数据编织
通过引入数仓语义层,打破了物流数据集市与数据应用间的壁垒。这种自动化的数据生产方式不仅提高了数据的时效价值,也使得数据分析不再受制于需求效应的局限性。在数据管理层面,由机器生成的数据更易于管理及维护知识图谱,使大语言模型的推理成本降低且幻觉现象可控,为基于大语言模型驱动的数据管理开辟了新可能性。
数据增强分析
当前NL2SQL方案通常面临准确率低及数据口径变动导致模型失效的问题。本方案通过构建高质量的数据资产图谱,尽管生成式AI存在潜在的幻觉问题,但数据生产与管理模块所构建的优质且严密的数据知识图谱已有效控制了推理风险。通过语义实体词典对用户的业务语言或指令进行语义理解和切分,结合RAG技术,可以精准找到最匹配的数据资产投影。大语言模型基于完整且准确的技术元数据生成的SQL不仅逻辑精确,更是在计算效率上超越了大多数数据分析师。
UData通过语义治理与建模分析平台,充分挖掘数据要素的潜力,成功统一了数据生产与消费的视角。通过对数据要素的深度整合与利用,打破了数据生产者与消费者之间的隔阂,提升了数据的价值转化效率。
1、直接效益
实现数据资源在企业内部开放共享,促进数据高效流通,使有业务决策需求的人员能够快速获得数据的驱动和支撑,实现数据资源的最大化利用和价值创造。基于过数据要素的流通应用,突破传统“先生产后消费”的数据管理模式,实现“以销定产”,以需求为导向,推动数据团队发现哪些数据资源是限制的、哪些是急需补充的,从而有针对性地进行数据资产的管理和优化。
● 提升数据分析效率:平台通过应用大语言模型自动生成SQL和报表,显著减少人工干预,提高了数据分析的时效性与准确性。生成的SQL准确率超过97%,远超行业标准(70%~80%),大幅缩短了数据资产使用人员在查找、使用和分析上的时间,大幅提升数据要素的流动效率,促进数据资产重复使用、多人共同使用、永久使用,从而促进业务营收增长。
● 降本增效:目前,该平台已面向一线业务用户应用,满足日常用量需求和智能生成报表需求,为企业节省大量成本,彰显数据要素的倍增效应和经济价值。
● 数据要素合规和风险控制:通过数据智能化处理与快速响应,用户无需自行下载数据明细即可完成数据分析。这种方式有效避免了因用户下载数据而可能导致的泄露风险。
● 数据生产与消费模式革新:本案例突破了传统的“先生产后消费”的数据管理模式,采用“以销定产”的策略,通过实时响应用户需求进行数据的生产,提升数据要素供给质量。
● 数据要素与劳动力要素协同,实现数据普惠:通过低门槛的数据交互方式,以及与企业协同办公软件的深度集成,企业全员无论是高层决策者还是一线员工,都能轻松地访问数据、理解数据、应用数据,使企业的数字化基础建设广泛赋能于企业的绝大多数群体,真正让数据意识和数据思维渗透到企业的毛细血管,实现知识扩散、价值倍增。推动数据要素与劳动力等要素协同,突破传统资源要素约束,提高全要素生产率。
2、行业效益
本案例响应国家“数据要素x”三年行动计划,形成了一套可复制的智能化数据分析和治理方案,有助于推动物流行业协同制造,树立标杆,推动多场景复用,共同提升行业效能,实现价值链延伸。
● 提升供应链行业效率:本案例通过精准的数据分析和预测,显著提升了仓储管理和运输路线优化等环节的效率。
● 促进行业智能化转型:本案例提供了一套可复制的智能化数据治理方案,为其他行业的数字化转型树立了典范。
·京东物流
京东集团2007年开始自建物流,2017年4月25日正式成立京东物流集团。京东物流是中国领先的技术驱动的供应链解决方案及物流服务商,以“技术驱动,引领全球高效流通和可持续发展”为使命,致力于成为全球最值得信赖的供应链基础设施服务商。
北京京东远升科技有限公司是京东物流集团的全资研发公司,通过探索创新技术服务与物流应用场景的有机结合,基于5G、人工智能、云计算等技术创新,不断提升供应链技术优势,在仓储、分拣、运输和配送等供应链重点环节,打造出数字化、智能化、软硬件一体化的物流科技产品和解决方案和解决方案,是实现京东物流以“技术驱动,引领全球高效流通和可持续发展”使命的载体。
·北极九章
北极九章成立于2018年,是下一代增强型数据分析领航者。通过打造人人可用的AI数据洞察引擎DataGPT,采用自然语言问答式交互,帮助非技术用户零门槛与数据对话,轻松、准确地从海量企业级数据中即时获得洞察。
DataGPT已经落地应用于国内数十家央国企、世界500强、中国500强企业,覆盖汽车、制造、能源、金融、消费零售、泛互联网等,标杆客户包括国家电网、国家能源集团、长安汽车、京东、伊利等。
北极九章多次被IDC等权威研究机构评为“增强式BI”代表厂商、“AIGC应用”代表厂商,核心参编中国信通院牵头制定的增强型数据分析工具、大模型驱动的数据分析工具等行业标准。