【留言赠书】智能供应链:预测算法理论与实战

文摘   2024-11-24 18:01   北京  
提到供应链,我们可能首先想到的名词是“计划”、“协同”、“决策”等等。在现代的供应链管理中,这些流程机制的实现,都有赖于对于供应链的精准预测——在掌握“现有信息”的基础上,对未来的事情进行“测算”,提前预知供应链各环节(规划、生产、库存、运输),更好地应对前端市场和后端生产侧带来的不确定性。

预测过程通常会根据所用信息和方法分为两种。

传统的供应链预测,一般是依靠定性的方法,依赖于专家的感知和经验,以及对历史情况的人工判断。例如,有的公司直接对于历史数据进行简单转换、拆解,得出未来的预测值;另一些公司利用市场研究报告对特定人群、细分市场进行调研,得到对于未来的期望值。这样的预测方法比较费时费力,结果也不可量化评估。

在现代供应链中,当历史数据充分且可以其中的模式将延续到未来,那么我们会优先采用定量的方法。企业的生产或业务系统会积累大量的实时或离线数据,对于数据加工及结果输出的效率要求很高,此时算法的作用就会凸显,

近年来随着算力、数据的不断完善,AI算法在供应链预测上被越来越多地使用——使用大规模数据以及数据科学理论,更加“定量”地把握供应链的未来动向。

供应链预测在企业中的成功案例也屡见不鲜,简单举个例子:

快消企业A曾面临着严重的商品库存成本过高、仓库协同及调拨困难等问题,其根源在于缺少对于前端需求的认知,缺乏准确可靠的预测数据。预测算法在改善其供应链管理能力的作用是,通过对历史订单、仓储信息的分析,对于仓储各环节的商品建立预测模型,提前预知各商品未来一段时间的需求量。供应链管理部门可以根据这些信息提前将货物放在距离实际需求最近的仓库中,而对于不确定性较大的商品则提供足够的安全库存,保证商品的高效履约。更重要的是,整个过程的成本相较有了之前显著降低,用更少的成本换来了更充足的货物履约能力——这一切的背后都有着AI预测算法的深度加持,电商场景通常拥有较大的数据量,因此我们可以使用深度学习算法对销量进行充分的挖掘。

比如DeepAR模型在实践中有多个优点,首先,DeepAR 模型对数据处理的要求较低,对于缺失的数据,DeepAR 模型会在模型内部直接补充缺失值。因此,在前期的数据处理中,我们不需要对缺失的数据进行人工处理。其次,DeepAR模型会对数据进行自动标准化处理,多时间序列预测、多量级预测、多时间长度预测的场景非常常见,自动标准化处理能在这些场景下较好地解决问题。例如,冷门商品和热门商品的销量可能存在非常大的差异,DeepAR模型的预处理方式是基于不同商品自身内部的标准化,使得它们具有可比性。基于这种内部归一化的处理方式,即便输入的是不同量级的数据,在进入模型之前,也会进行自归一化处理。

在输出结果上,DeepAR模型也有其优点。第一,它的输出结果为概率分布。相较于其他基于RNN拓展后直接输出一个确定预测值的模型,DeepAR模型的输出方式是输出一个概率分布。我们可以将预测值的期望或最大概率作为最终的预测值,这有利于我们对预测结果的有效性进行评价,同时还有利于我们进行后续的库存优化。第二,DeepAR模型会自动挖掘多个时间序列之间的关联,这个特性让DeepAR模型可以包容常规预测中的多种不同类型SKU的预测结果。例如,假如我们有几份苹果的历史销售数据,那么对于销售时期相对较短的梨子,DeepAR模型可以根据苹果的历史销量数据,预测梨子的未来销售趋势。

实践中另一个流行的常规预测思路是集成学习策略,电商场景在SKU和商品种类方面更丰富。有限的特征不一定能完美地概括商品的所有属性,因此针对电商场景可以尝试使用另外一种模型池,以及更加灵活的集成思路,即WEOS方法。WEOS采用的是分类选型的方法,我们可以结合业务经验的特征将时间序列数据分为不同的类别,然后对不同类别的SKU分别确定子模型权重。根据SKU对应的类别使用相应模型池进行预测,最终以时间序列数据的加权预测结果之和作为预测结果。根据上述模型框架,具体可以分为如下几个步骤:参考业务经验的特征进行时间序列分类→为每个类别选择初始模型池→通过滚动回测方式衡量每个子模型的预测误差→模型选择与权重确定→计算最终预测结果。

在海量数据的加持下,我们也可以选择使用复杂度更高的深度学习算法,以目前比较火热的Transformer为例,相比与传统的机器学习、深度学习它有几个显著的优点。首先Transformer的模型结构在深层之下更加复杂,可以建构与学习的信息量更多;其次是Transformer模型更加擅长于序列长期依赖挖掘,相比与传统机器学习在面对长期相关性探索时需要进行的人工样本对齐,Transformer可以自动进行全局扫描计算注意力得分,可以自动挖掘出更多序列上的长距离相关信息特征;第三是Transformer模型在特定的网络结构下可以输入模型的数据模态更加丰富,可以把日期、文本等不同模态的数据输入进行挖掘,带来相比于传统方法更多的数据优势。在以上的优点之下,Transformer能在海量数据中表现出比传统方法更好的效果。

如果你对供应链行业感兴趣,也有意向走进预测领域,那么你可能需要从以下几个方面积累能力和经验:

1.数据思维。无论是选模型、看业务,都依赖于对于数据本身的了解,我们要学会基于数据洞察方法来透过数据看问题,可能是业务问题,可能是数据本身的问题,也可能是算法问题。数据驱动思维决定了我们看待数据的角度,对于数据质量的洞察决定了最终的预测是否有效。

2.建模能力。建立一个可靠的预测模型需要算法工程师多个层次的能力。首先,你需要掌握基本的统计学模型常识和常用方法,并知晓其背后的计算原理、应用场景、基本参数。而后,你需要懂得如何利用现有的数据,让数据在模型中既“能表达”,也要对数据表达的信息有所取舍,让模型发挥最恰当的作用。更重要的,还需要持续纠偏,预测在某种程度上其实是一个持续跟踪与纠偏的过程,比如跟踪预测方向的偏离,预测幅度的偏离,预测变化的偏离。在发现偏差后,首先要分析偏差原因,是市场有了变化还是内部执行出现问题,找到了偏差的真正原因,才能够有的放矢地进行后续操作;其次找到原因后,要采取相应的措施,比如拔高或降低预测,修正我们的预测模型,比如认定为特殊个案或者可以承受而暂不采取措等等;最后,我们要跟踪采取措施后的结果,再回到第一步,进行纠偏循环,不断地记录、分析与预防。

3.行业认知。供应链行业与完全线上化场景不同,其中的预测算法一般并非是单一目标去极致追求准确率,而是要帮助到实际的业务表现。在这个行业下的算法工程师不仅要看数据、看模型,更要将视野放宽到业务层面。事实上,供应链预测算法的设计往往是根据具体业务目标取舍后的结果。这都决定了预测算法如何设计——使用传统算法保证效率再快速迭代,抑或是融合库存策略信息从而帮助库存决策优化,这些设计思路都是来源于实际的预测使用场景。

4.创新思维。作为算法工程师,持续迭代并在这个过程中不断创新的意识是十分关键的。具体在预测领域,

创新并不一定是从理论层面重新推导一个全新的模型,而是使用创新方式解决实际发生的预测问题。这其实包含两个层级:第一,需要持续关注当前算法中存在的问题,预测算法有着“No free lunch”的特点,任何一个策略都有其假设和处理边界;第二,针对当前算法无法处理的问题,在模型结构、数据处理、特征融合中进行创新。

跳出固有的预测方法论,引入业务视角来完善算法方案,不拘泥于眼前的技术认知。所谓最复杂的不一定是最好的,预测不是算命,科学的预测是有所为,有所不为,找到最合适的才是创新的本质。

本文摘录于《智能供应链:预测算法理论与实战》,是作者深耕供应链预测领域十年的心血之作,本书几乎包含了供应链预测所需要的所有技术内容,提供了预测算法相关的从入门到精通的保姆级教程,从基础模型篇到进阶模型篇,再到行业实践篇,一步步带你夯实数理基础,跟进前沿算法策略,并深入供应链行业的建模案例。授人以鱼,不如授人以渔,一书在手,助你预测无忧,扶上快马,送你广阔一程。

   互动有奖

按以下方式参与互动,即有机会获赠图书!

活动方式:在评论区留言参与与本书相关的话题互动。活动将产生3名获奖用户,每人赠送一本【作者签名版】《智能供应链:预测算法理论与实战》

说明:留言区收到回复“恭喜中奖”者将免费获赠本图书,中奖者请在收到通知的24小时内将您的“姓名+电话+快递地址”留言至原评论下方处即可,隐私信息不会被放出,未在规定时间内回复视作自动放弃兑奖资格。

活动时间:截至12月2日开奖。

快快拉上你的小伙伴参与进来吧~~

DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
 最新文章