用五种数据分析模型研究养猪,里面的门道究竟有多深?!

职场   2024-11-12 18:01   江苏  



“大家好,我是李启方!今天来跟大家聊聊种猪养殖数据分析。

公众号后台回复 “2024” 即可领取最新全套数据分析资料包!

老李最近看到一个有趣的种猪养殖分析案例,这个案例首先从波士顿分析断奶,杜邦分析繁育,趋势分析分娩率,折线比较不同配种,四象限+点图+箱线图分析途损率。然后用箱线、点图组合分析配种、断奶、途损关系。制定了最优结构和最优配种度,同样,作品采用了企业脱敏数据,分析内容丰富、分析思路清晰、分析方法多样。非常值得大家学习!

正文开始前,老李先给大家推荐一个《帆软行业场景建设白皮书》总结了覆盖制造、金融、国资央企、消费零售、物流交通、电力水务、建筑地产、医药健康、医疗卫生、高校教育等10大行业、24个细分行业的解决方案。旨在各行各业的IT、数据从业者提供在其所属的业务场景下,现成的解决方案和蓝图参考,从而帮助他们快速落地数据分析和展示平台扫描下方二维码即可下载完整PDF!

01
业务背景与需求梳理

业务背景

某种猪养殖公司总经理,在面对猪价持续低迷的市场情况下,公司只有持续提升仔猪断奶的数量与质量,才能增加公司经营收入。在对近一季度的产量复盘中发现,不同场线的产量差异较大,但是公司为标准化企业,生产流程、工艺以及技术支持均一致,到底是因为什么问题,导致了场线的产量差异,通过生产技术与以往经验管理分析,无法寻求到答案,故另辟蹊径,通过对数据进行深入的分析,寻求改善产量的关键因素。

 需求痛点/问题梳理

公司为已投入运营的成熟种猪养殖企业,主要向市场提供优质的断奶仔猪获取应收。公司共有10条标准生产场线,10条场线规模一致、建造工艺一致、设施设备配置一致且齐全,且断奶仔猪客户共享。在经过3年的饲养时间后,10条场线一个批次提供的断奶仔猪产量出现比较大的差异,且在与客户交接时,不同的场线提供的仔猪质量也存在较大的差异,最终反馈在数据上,则为途损率差异较大,产量差异较大。

作为公司经营者,为什么同样的场线,同样的现有生产技术要求,生产成绩会差异那么大?怎么做,可以保证每条场线都做到一样的优秀?优秀的场线到底做对了什么,差的场线到底没做什么,希望通过我们的数据分析,给出生产管理方面一些正确的小建议。

原因探索一:单指标量影响,分娩率起绝对作用

  • 配种数越多,是否断奶仔猪数越多;

  • 窝断越高,是否断奶仔猪数越多;

  • 分娩率越高,是都断奶仔猪数越多。

原因探索二:指标深入分析,不同配种来源,影响绝对受胎率

  • 分娩率+35天后妊娠损失率=35天受胎率;

  • 配种结构对受胎率的影响。

原因探索三:单指标量对途损率的影响

  • 是否断奶仔猪数越多,途损率就越高;

  • 是否加权断奶均重越小,途损率越高;

  • 断奶日龄与途损率的关系;

  • 不同场线的途损率差异。

原因探索四:由断奶日龄越集中,途损率越低,推导配种越集中,途损率越低

  • 不同场线的断奶前死亡率差异;

  • 断奶日龄越集中,途损率越低;

  • 三天集中配种完成、四天集中配种完成以及五天集中配种完成与途损率的关系。

建设目标

通过对10条场线,一个季度的生产数据从配种到分娩到断奶到客户确认产量的全流程数据进行分析,对断奶数量与因仔猪质量差异造成的途损率的差异的影响因素进行各要素的分析,找出影响断奶数量与仔猪质量的最关键的2个因素,从而给出规范一线生产最需改善的生产动作,最终实现所有场线产量达标或超量完成标准的效果。

02
数据来源与指标说明

数据出处

随机函数生成的脱敏数据,本次涉及的底表的表结构参考了数仓处理好后的ADS表,并进行数据脱敏、调整。

数据表

01,配种-产仔-断奶12批;

02,后续验证;

03,配种-产仔-断奶-集中度;

04,相关系数。

备注1:因一头猪从配种到断奶所需时长为115+24=139天,因配种为一周一个周期,一个配种批次,故共10个配种批,为保证数据前后一致性且具有关联性,则需选取全部已断奶的配种批次进行计算。则选取10条场线2022年4季度第1周至第12周的配种批次进行计算。从配种到分娩到断奶的全链条数据;

备注2:由于BI不具备计算相关系数的功能,故此次作品涉及到的相关系数,皆由外部软件提前处理好后,再将结果导入BI。

指标说明

03
分析框架与数据处理

分析思路

综合2W1H+PDCA循环,探究断奶仔猪质量(途损率)、数量(断奶仔猪数)的提升策略(场线单批次断奶仔猪数>1320、途损率<1%),最终实现高质量完成产量目标(产品>1307)的要求。

其中2W1H拆解如下

  • What:展现当前经营指标(产量、断奶仔猪数、途损率)、过程指标概况;

  • Why根据公式法,拆解出断奶仔猪数的可能影响因素、途损率的可能影响因素,做出假证并分析验证;

  • How通过数据分析以及业务沟通确认,提出生产改善动作。

PDCA拆解为四阶段:

  • P计划:通过2W1H的分析过程,根据生产改善工作建议建立改善目标与行动方案,包含制定行动计划、明确目标(场线单批次断奶仔猪数>1320、途损率<1%),制定行动方案;

  • D行动:实施行动计划,即按照计划行动,目标是“做对的事”,执行就是“把事做对”;

  • C检查:检查并评估效果,即查看计划是否行动,执行是否彻底,是否达到预期效果。若效果明显,则提炼计划的执行的核心内容,继续严格按计划执行;

  • A处理:标准化和进一步推广,即对计划的核心内容进行标注化、通俗化、可推广化内容的编写,以便将好的经验与生产管理内容普遍应用。

具体分析思路见下图

⁢⁢‌‬⁢⁣‍‍⁡⁢⁡‍‍⁢‍⁢⁣⁡⁣‬‌⁡‍‬‬‌⁣⁤⁢‍

首先对结果进行对比,然后通过对影响结果的指标进行逐步分解,排除生产管理因素影响的指标,寻找主要影响因素,最终锁定分娩率与批次断奶日龄集中度为主因。

然后根据影响主因的关键生产动作进行再提炼,最终溯源到配种组成与配种时间上。通过追踪改善配种结构和与配种时间的场线,场线生产结果是否达到预期效果来再次验证以上分析的正确性与主因识别的准确性。最终完成数据分析对断奶仔猪质量与数量提升的管理指导。

分析方法

  • 公式法(类杜邦分析):通过公式法,逐渐拆解出断奶仔猪数、途损率的相关影响指标,为后续假设验证做基础;

  • 波士顿矩阵:呈现目标场线途损率、断奶仔猪数两个经营指标的完成情况,是正常,还是预警,或是需要重点关注;

  • 对比分析:通过与标准值对比、采取措施前后的对比、场线之间以及批次之间的对比等,发现数据差距、差异、异常等情况,从而为数据分析提供分析方向;

  • 相关性分析方法:通过对单一指标与结果指标的相关系数计算,推算过程指标对结果的影响程度(本报告认为相关系数绝对值超过0.5才可认为具有较强的相关性)。

数据处理

遵循“数仓负责数据处理,BI负责数据分析”的开发理念。数据处理工作,已基本在数仓中处理完毕。在BI中仅涉及少量的处理工作,如衍生指标的新增、数据集之间的合并处理。下面仅简单展示部分处理:

  • 新增列

  • 上下合并

04
成果展示

What:22年Q4断奶仔猪繁育——经营指标概览

本养猪公司为已运营三年且成熟稳定的种猪养殖企业,主要通过向市场提供健康的断奶仔猪来获取收入。公司内共有10条标准生产场线,获取营收流程为场线提供断奶仔猪给客户,客户将对猪只进行挑选,对认可的猪只确认产量,对不认可的猪只计入途损,断奶仔猪数减去途损数才是最终各场线的产量。各场线建造工艺、设施设备、人员生产要求完全一致,且对外对接的客户完全共享。Q4各场线的产量出现较大差异,断奶数量与途损率指标,各场线表现不一。反思生产管理要求,各场线要求与落地情况一致,故需通过数据,进行深入分析。

What:22年Q4断奶仔猪繁育——过程指标概览

猪只养殖受限于猪只的生理特性,故所有的生产指标均按照猪只的生理特性进行设定。公司向市场提供的断奶仔猪的根源则是母猪的配种,而配种后的分娩率以及窝断水平决定了断奶仔猪数量。因面向市场时,客户对仔猪的基本要求为哺乳日龄在20日龄以上,体重在5kg以上。故需分析对产量的影响因素,根据以上杜邦图解分析,共有21个指标影响最终的产量。因管理具有同质性,可通过指标是否有一致性进行验证,对于一些差异较大的指标,则需更进一步的分析,从而找到影响最终产量的因素——也就是断奶仔猪量和途损率(质量的量化指标)。

Why:原因探索一,单指标量影响,分娩率起绝对作用

  • 配种数越多,是否断奶仔猪数越多?

通过Q1中的数据图可看出,虽然配种数在超过132时,出现一定程度的断奶仔猪数增加,但是配种数控制在126-132头时,断奶仔猪数超过标准的可能性更大;

  • 窝断越高,是否断奶仔猪数越多?

通过Q2中的数据图可以看出,在窝断超过11头时,断奶仔猪数并未出现任何突破,反倒是在窝断在接近11头时,断奶仔猪数表现出较高的水平;

  • 分娩率越高,是否断奶仔猪数越多?

通过趋势线可发现,分娩率与断奶仔猪数呈现较吻合的关联性,两者的关联度也呈现最大,为0.59。

Why:原因探索二,指标深入分析,不同配种来源,影响绝对的受胎率

分娩率=35天受胎率-35天后妊娠损失率

  • 通过Q1的数据图可以看出,35天后妊娠损失率极大值与极小值的差异仅为1.4%,且35天后妊娠损失率均控制在3%以内,而分娩率的极差达到了7.4%,35天后妊娠损失差异度对分娩率的影响要小于35天前的损失,则需对受胎率的差异进行分析,从而进一步探究分娩率的差异性;

  • Q2数据图展示配种批与场线维度中不同配种类型(后备母猪、断奶母猪以及问题母猪)的对比,可以看出,断奶母猪受胎率>后备母猪受胎率并远远大于问题母猪受胎率,且只有在问题母猪配种占比小于1%时,问题母猪的受胎率才会超过93%;

  • 为保持母猪生产的可持续性,每批次后备母猪配种数不得少于24头。若批次配种128头时,问题母猪配种数不得超过1头。

Why:原因探索三,单指标量对途损率的影响

  • 从Q1数据图可以看出,断奶仔猪数与途损率呈弱相关;

  • 从Q2数据图可以看出,断奶均重与途损率呈弱相关;

  • 从Q3数据图可以看出,各场线途损率差异较大,有的场线途损率持续较低,有场线途损率持续较高;

  • 从Q4数据图可以看出,断奶日龄与途损率呈弱相关;

  • 以上单指标与途损率的关系均不明显,但通过Q3可以看到,途损率在各场线的各批次的表现差异较大,且途损率仅有H四线与H五线始终保持在标准范围内,对以上两个场线以及与仔猪客户进行线下沟通发现,两条场线的共同点均为各批次断奶仔猪均匀度较好,断奶日龄较为集中。

Why:原因探索四,指标深入分析,配种集中度越高,断奶日龄越集中,途损率就越低

  • 从Q1数据图可以看出,各场线因产房管理水平一致,故断奶前死亡率均控制在标准范围内,且中位数基本保持一致;

  • 从Q2数据图可以看出,各批次的断奶日龄越集中,箱型图的箱体越小,则途损率越低;

  • 因各场线断奶操作一致,造成断奶日龄差异的根本原因则为配种集中度;

  • 从Q3数据图可以看出,三天配种集中度完成100%时,途损率较为集中在1%左右,甚至在标准途损率1%以下,四天配种集中度完成100%时,途损率控制在标准1%的概率较低,若五天或以上完成配种时,途损率均不能控制在标准1%以内。

How:制定措施,拟定行动计划(Plan)并执行(Do)

根据以上分析总结,P场线为需要进行主要改善的场线。改善产量(即提升断奶仔猪质&数)的最根本的解决方式为调整配种动作,主要指调整配种结构以及调整配种时间,具体的工作要求为:批次问题母猪参配率控制在1%以内,且三天集中配种度完成100%。

How:制定措施,拟定行动计划(Plan)并执行(Do)

  • 制定改善计划后,对主要出现产量异常的P场线进行重点追踪;

  • 通过调整配种结构和配种时间,五条P场线近一月在产量方面均达到了标准产量(1307头)的要求,且其断奶仔猪数、途损率均控制在标准线(断奶仔猪数>1320、途损率<1%)以内;

  • 通过以上问题分析以及执行追踪可确定,该分析方法切实有效,分析结论对生产管理具有指导意义,提高断奶仔猪质与量的根本措施为调整配种结构与配种时间。

Chapter5,Act:总结经验,标准化和进一步推广

  • 为保证断奶仔猪质量(途损率<1%),则需提高断奶仔猪日龄集中度,最根源的解决办法为提高配种的集中度,一个批次的配种跨度最长为7天,但若配种跨度超过5天,则途损率会严重超标,若要途损率控制在1%以内,三天集中配种度需完成100%;

  • 为提升断奶仔猪数量,则需保证猪只配种分娩率,最根源的解决办法为控制问题母猪参配占比,问题母猪参配占比不得超过1%。

最终仪表呈现结果


可以上下滚动的图片

本次分析案例的作者为养猪新观察,作品荣获帆软2023年BI数据分析大赛最具业务价值奖作品以问题“相同配置的生产线,为什么仔猪断奶的数量与质量不同”出发,引出可能的影响因素,再基于数据找出最关键的2个影响因素。此外,采用企业内部脱敏数据,分析思路很清晰,紧紧关联业务,运用多种分析方法,前期仪表板规划清晰,落地仪表板内容丰富、风格清爽、配色统一,展现了作者扎实的数据分析与业务决策能力,是一个高质量的养殖数据分析案例。非常值得大家学习!点击文末阅读原文即可下载完整模板,大家可以自行尝试自助分析哦~
长按👇关注 - 设为星标 - 干货速递

你点的每一个,都汇聚成数据之光!

点击“阅读原文”,获取分析报告模版和工具

数据分析不是个事儿
分享数据人的干货!
 最新文章