数据分析十大模型之决策模型

科技   2024-11-01 08:30   上海  


“能不能建个模型,分析下怎么决策才好!”是工作中经常被问到的问题,也让很多数据分析师头大。“这决策咋做,还能建模?咋不让我去算命呢!”是常见的吐槽。


其实数据驱动决策,有一套模型可用,但是有很多前提条件限制。今天跟大家系统分享一下,看完以后大家就会发现:即使只掌握了梳理模型的过程,也是大有帮助的!


建立模型的前提


企业做决策,有固定模式

1、明确决策对象(收入端/生产端)

2、了解业务现状(渠道/产品/产能)

3、清晰未来目标(收入最大/成本最小)

4、清晰制约因素(短期内不可改变的东西)

5、清晰待决策因素(短期内可以改变的东西)


我们可以把这个过程,用下图表示:



科学决策和算命大师的最大区别,在于:科学决策以数据为基础,从来不瞎猜。如果目前不了解情况,那么得:先做描述性分析,把情况搞清楚,这是建立模型的前提。


比如某个企业做公众号投放获客,历史投放曝光量、转化数据、可投放次数记录如下,该怎么建立分析模型呢(如下图)。



答案是建不了!因为基础信息都缺很多呀:

1、决策目标是啥?控制成本?提高获客量?

2、制约因素是啥?我司有多少投放经费啊?

3、某些特定渠道,是不是必须投XX次啊?


这些基础情况都不知道,肯定没法建模了。补充基础信息是第一步。


模型建立过程


假设信息补充完成:

1、目标:获客数量最多

2、制约条件:总投放费用3w

3、制约条件:无特定渠道数量限制

4、待决策因素:每个渠道投放多少次


那么可以开始建模了,我们先把业务上的描述,转化为数学描述(如下图)



之后,可以建立线性规划模型,求最优解。很多工具都可以求,简单比如Excel,自带规划求解功能,python可以用scipy.optimize.linprog函数求解。这里用Excel举个简单的例子,只要把目标、约束条件、待求解因素丢进对格子,就能自动计算出最优解(如下图,自动显示在单元格里,即30000约束下最大获客量4295)。



梳理清楚逻辑以后,只需要简单几步就能算出答案,非常好用。


模型如何使用


注意!即使没有模型,手工也能做处理。一般做投放的同学,会用每个渠道投放费用/获客数量,计算每单位获客成本(CAC),然后看哪个渠道的获客成本低,就先把这个渠道全部投满,然后看看手头还剩多少钱,继续投成本第二低的。整个操作如下图所示(如下图):



既然可以手工操作,为啥还要建模呢?答:因为建模以后计算起来方便。比如:

1、修改目标:目标改成满足4000获客情况下,费用最少

2、修改条件:A、B渠道报价、次数有调整

3、增加新选项:新增渠道F、G、H,一起考虑

……


当情况出现变化时,可以通过调整模型参数,直接输出结果,比手工安排效率高多了。



看到这,有同学会问:既然模型这么好用,为啥很少听人提起呢?因为现实工作中,常有问题制约了模型建立,比如……


模型的制约因素


制约1:基础数据的采集。比如:

1、我们的设备基础产能是多少

2、我们的销售有多少人,人均产出多少

3、最好的 VS 最差的差异有多大

4、表现是否稳定,是否有季节差异


这些基础的数据采集与分析结论是非常重要的。掌握基础数据才好建模。而很多情况下,描述性统计都没做到位,只看个平均数就盲目拍脑袋上马,很容易出现“集齐10个孕妇就能1个月把孩子生出来”的错误。


制约2:清晰的业务目标。目标不清晰,是企业通病,比如:

1、领导说:“你看看可以咋优化下”……这压根没目标呀

2、分析前说:“预算OPEN”分析后说:“投入太大了,你也得考虑实际呀”

3、分析下,既能投入最小,又能产出最大,又能效率最高,还能……


目标不存在,目标很混乱,会导致模型的公式都写不出来,不要说解模型了。而目标堆叠一大堆,会直接导致模型无解。线性规划方法中,有2阶段法可解双目标情况下最优解,但经验上看,一般有50%概率无解。因为模型只是业务情况的模拟,不是魔法,不能把你原本拉胯的业务变得神威无敌……


一般多重目标情况下,我们都建议:聚焦一个主要目标,把另一个变成约束条件。比如:

  • 优化前:既要成本最低,又要收入最大,这是典型双目标!听着就蛋疼

  • 优化后:成本低于XXX万的情况下,收入最大


这样把双目标改为条件后,不但能求出最优解,而且可以通过测试,找到当前约束条件下,成本极限在哪里(超过极限就解不出满足期望的最优解),这样反向推动业务提高运作能力。


制约3:稳定的业务表现。建模过程中,假设参数是固定的。这个在营销端比较难,因为很多时候用户响应率是玄学问题。所以线性规划模型在生产端用多。因为生产端的设备表现往往有固定参数,且生产端目标清晰(给定成本产出量最大/给定产量成本最小)。在营销端,往往用分类模型或者响应模型。


综上可见:建立模型的过程,远比模型本身更有价值。在建立模型过程中,会暴漏数据采集的问题,会暴漏目标混乱,思路不清的问题,会发现业务规律性,这些都能极大辅助决策,帮我们把决策拉回到客观、理性的道路上。


一个数据人的自留地
数据人交流和学习的社区,关注我们,掌握专业数据知识、结识更多的数据小伙伴。
 最新文章