电商-必知必会的购物篮分析(附案例实操)

职场   2024-12-19 17:55   江苏  



“大家好,我是李启方!今天跟大家聊聊电商数据分析

公众号后台回复 “2024” 即可领取最新全套数据分析资料包!

老李最近看到一个有趣的电商销售数据分析案例,这个案例整体分析框架做的很详细,从运营、销售二个方面且采用购物篮、帕累托等多种分析方法,其次落地仪表板内容也很丰富,选用的组件类型多样,图文结合,配色也很统一。非常值得大家学习!

正文开始前,老李先给大家推荐一个《帆软E数通电商数字化分析方案,本方案通过行业产品E数通,满足企业电商数据获取、整合、应用的全链路需求,让企业精细化电商运营更简单。扫描下方二维码即可下载完整PDF!

01
业务背景与需求痛点

简述业务背景

电商用户消费行为数据,包含日常用户的订单消费信息,部分用户信息等。

简述需求痛点

业务人员并不能用肉眼从海量的数据库数据中挖掘价值,赋能业务。但通过可视化,海量的电商消费行为数据可以被更好的整合并展示给不同部门的管理层及业务人员,从而达成“数据赋能决策”,为公司及平台创建更多价值。

因此在本次数据仪表盘中,我们决定把数据运用于不同的业务方向进行分析,希望能使得销售及运营部门的管理决策层可以更好地了解目前平台的现状,从而进行更加高效且清晰动态方针调整。

02
数据来源与分析思路

自选数据来源:和鲸社区,电商用户消费行为数据 —— 564169条数据

字段解释:

  • event_time:用户进行物品购买的时间戳

  • order_id:订单id

  • product_id:产品ID

  • category_id:分类ID

  • category_code:产品一级分类 —— 大类(e.g. electronics/furniture)

  • category_code_1:产品二级分类 —— 成品/中等分类(e.g. peripherals, kitchen)

  • category_code_2:产品三级分类 —— 组件/细致分类(e.g. cpu, tv)

  • brand:产品所属品牌

  • price:产品定价

  • user_id:用户ID

  • age:用户年龄

  • sex:用户性别

  • local:用户所属地区

分析思路

拿到数据后的分析思考过程 ——下图为自己整理的数分思维模型

由数据我们可以清晰的知道以下一些信息

  • 订单信息: 包含了购买的物品种类(e.g. 一级/二级),品牌,下单时间,价格及订单id等信息

  • 用户信息:包含性别,user_id,用户所属区域等信息

在整体电商平台的组织架构中,销售和运营是两个相对较大的板块,这也是数据能提供巨额价值的领域。此次的BI仪表盘,我们决定针对这两个部分进行细化分析,从而为管理层提供可视化研究,完成“数据驱动决策”的目标

思维导图(具体分析思路)


  • 针对销售部门,我们希望突出重头商品的存在。在经过一定模型的匹配后,我们认为帕累托(ABC)模型更加适合突出重头商品,即“少数商品贡献了大部分价值”。

  • 针对运营部门,我们则希望进行用户精细化运营,通过不同关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户采取相应的营销策略。在挑选之后,RFM模型是我们认知中最为适合的一个分析模型。

03
数据处理

针对此次数据,我们主要进行了三个步骤

  • 缺失值处理:当拆分一个字段去多个字段的时候,我们需要把缺失值变成空值(e.g. category_code/category_code1等都是由一个字段拆出来的)。其中,空值不做处理,因为他也代表了一个用户消费过的记录

  • 重复值处理:我们不希望重复的数据影响到我们的数据分析,所以对于重复出现的数据我们只保持第一次出现的样式

  • 数据整理(RFM):数据整理,把所有的数据整合成我们需要的样子。(e.g. 我们希望用户可以被RFM模型分割为8种类型的用户,从而我们可以进行用户的精细化运营)

为了使用RFM模型进行用户标签,进行精细化运营,我们首先需要根据不同的指标进行打分,从而进行用户分群。

具体步骤

  • 在自助数据集中找出代表RFM三个字母的字段 

  • 把字段转换成可以量化的Numerical Variable 

  • 求得字段均值 

  • 如果数值超过均值,把字母分值设为1,如果数值没有超过均值,把字母分值设为0 

  • 结合三个字母的分值,并贴注Label

04
可视化报告

数据含义表达和图表排版布局

整体排布会遵循我们在上方表述的思维导图,主要分为两个板块展示(销售/运营)。为了使得不同部门的管理层与业务人员可以更快的找到自己需要的报表,我们使用Tab来进行切换

总体的排布我们会遵循上面的思维导图。但是经由我们测试过图例之后,我们认为下面的图形排布将会更加符合我们的逻辑拼接以及展示

销售部分总结

  • 时间序列销售情况分析

通过查看时间序列销售额的变化:从月份和季度两个维度,我们发现销售额的分布不均匀,且在第三季度的电商销售额远大于另外几个季度。

然后,我们通过月环比图,对销售额的变化进行进一步探索,发现5月较上月增长幅度极大,我们猜测是由于当时疫情好转从而刺激了消费;销售额在2、3、7、8、10月增长,而在4、6、9、11月份的销售额呈现减少的趋势。

  • 用户基本信息分析

性别我们从图中可以发现男女人数大致相同,消费者年龄总体较为年轻。地区我们从图中可以看出上海、北京和广东的消费总额较高。

  • 商品内容分析

  • 商品各分类销售额分布

首先我们通过树图对不同类别的电子产品销售额进行了展示,发现电商产品一级分类下的electronics、appliances和computers 类型占据了较大的销售额。

其中,在对数据的探索过程中,我们发现,一个订单可能包含多个类别的商品。因此,经过模型比较,我们选择采用购物篮分析的方法进一步探索不同类别产品间的关联性。

  • 购物篮分析

因此,我们打算使用购物篮分析的方法,去探索购买商品间的关联性,从而为不同类别产品间的相关推荐提供数据支持。不同类别产品之间的支持度、置信度和提升度如图所示。

通过提升度热力图的可视化展示,我们发现其中有些商品类别的组合会有较高的提升度(e.g. Sport与Auto,Country_yard与Construction)

  • 品牌

对于不同品牌的销售额,我们打算先使用帕累托分析法去找出重头品牌,再对重头品牌做进一步的分析。

  • 帕累托分析法

通过帕累托图,我们发现 Samsung ,Apple,LG,Asus,Lenovo 品牌的商品是重头商品,这5个品牌的销售额占比达到总体品牌的62%。接下来,我们对这5个品牌的销售额的时间序列进行分析,查看这几个品牌在不同时间的销售额,以及总体的趋势。(点击右侧帕累托图的柱子,即可分别查看每个品牌销售额的时间序列折线图)

Samsung 、LG和Lenovo品牌的销售额在8月保持较高的水平,在9月出现了下降,而10到11月销售额波动较大;Apple 品牌的销售额在8月和9月都达到了较高的水平,且在9月达到了一个极高值;Asus品牌的销售额在8月达到较高值,而后出现下降的趋势,在10月有过较为明显的上升。

运营部分总结

  • 用户整体活跃情况与留存分析

通过PV/UV图,我们可以发现在某些特定时间段中,UV远低于PV,代表部分用户进行重复行为较多。其中,2020-04-27至2020-09-07期间,PV/UV上升较为明显,7、8两个月用户活跃度较高。

周一至周四为低消费时间段,不同性别用户下单总金额相差不大,男性稍微领先。周五至周日为高消费时间段,女性活跃度高于男性,其中周六差距最大,且整体活跃度最高。

建议:关注7、8月活动,有效刺激到消费。平稳时间周期关注周五至周日,针对女性加强宣传、刺激消费的运营活动。

  • 次日与七日留存

次日留存率与七日留存率呈现整体上行的趋势,七日留存较次日留存稍微低一些。其中,次日留存率在2020年4月2日至2020年4月25日,与2020年7月26日至2020年8月9日期间达到约45%。

  • RFM用户分群分析

通过不同群体用户面积图,我们可以发现,重要保持客户群体是消费最多的客户群体,一般发展客户次之,一般挽留客户的消费较多,而重要价值客户、重要发展客户和重要挽留客户的消费额较少;一般价值客户和一般保持客户的消费额很少。因此我们需要加大重要价值客户、重要发展客户

05
价值总结 

通过对销售额的描述,我们可以发现如下的一些结论

  • 电子产品在第三季度的销售额远大于另外的几个季度。

  • 男女人数大致相同,消费者年龄主要位于20-50岁。

  • 上海、北京和广东的消费总额较高。

促进销售额提升的建议

1. 对于不同消费额的时间段采用不同的方式促进消费

  • 在消费额较高的时间段内进行广告推广,加大与各大品牌合作从而稳定或提高消费额。

  • 在消费额较低的时间段内加大宣传力度,提供优惠措施,从而促进消费。

2. 对销售额较高的地区,进一步推广或者提供促销活动

3. 对于帕累托分析筛选出的5个重头品牌,我们可以采取以下的措施

  • 加大推广与合作力度。

  • 通过关联规则挖掘其他具有提升度的商品,对其进行推荐组合,促进消费。

4. 对于帕累托分析发现的众多非重头品牌,我们可以采取以下的措施

  • 通过关联规则找出具有提升度的商品,对其进行产品组合,从而提高销售额。

  • 采用促销和优惠的方式吸引用户购买。 

运营

  • PV和UV总体变化不大,均在8月达到较高的值。

  • 周一至周四为低消费时间段,不同性别用户下单总金额相差不大,男性稍微领先。周五至周日为高消费时间段,女性活跃度高于男性,其中周六差距最大,且整体活跃度最高。

  • 次日留存和七日留存率呈现整体上行的趋势,七日留存较次日留存稍微低一些。

  • 重要保持客户群体是消费最多的客户群体,一般发展客户次之,一般挽留客户的消费较多,而重要价值客户、重要发展客户和重要挽留客户的消费额较少;一般价值客户和一般保持客户的消费额很少。

营销建议

  • 对于某些用户数较多的地区提供优惠活动维护用户;对于用户数较少的地区,则采用通过加大宣传力度等方式提高用户数。

  •  关注7、8月活动,有效刺激用户消费,挑选可控变量, 通过AB Testing假设检验来寻找活动模型并长期应用。

  • 平稳时间段关注周五至周日时间段,加强针对女性的宣传、刺激消费的措施。

可视化仪表看板

可以上下滚动的图片

本次分析案例的作者为超可爱,作品荣获帆软2022年BI数据分析大赛优秀作品奖整体外观效果来说,荧光绿的突出和深色的底色满满的科技感,美观大方;加入了动态元素的设计,让仪表盘整体更生动。内容而言,从两个角度对内容进行区分,满足不同阅读者的需求,非常人性化的布局。展现了作者扎实的数据分析与业务决策能力,是一个高质量的电商销售数据可视化案例。非常值得大家学习!点击文末阅读原文即可下载完整模板,大家可以自行尝试自助分析哦~

最后给大家推荐一场电商财务直播,就在今晚20:00

🔥 直播主题:《快速打造电商财务对账看板,解锁BI使用新场景》

👊 锁定直播,带你了解电商行业目前对账方法,二步学会用FineBI对账

更有天猫平台对账系统的实操案例解析,打造电商财务对账看板,助力财务人员职业发展和企业财务转型!

扫描下方二维码即可预约直播!

长按👇关注 - 设为星标 - 干货速递

你点的每一个,都汇聚成数据之光!


点击“阅读原文”,获取分析报告模版和工具

数据分析不是个事儿
分享数据人的干货!
 最新文章