嘉宾介绍:
互联网人|头部大厂+商业分析师
计科硕士|机器视觉方向+Transformer炼丹
职业轨迹|初中教师➡️程序员➡️分析师
Part 1
我从数据分析转商业分析的收获,
两者定位和职位的区别
1、SQL不再是工作重心
对比数据分析师,我所在的商分团队不接外部需求,摆脱了数据分析师 SQL 工具人的尴尬定位,所有的看板和底表都为自己的分析服务。同时获得了更多的产研资源,可以有研发同学帮忙完成繁琐的基础工作,彻底从 SQL 离解放出来。SQL 对于现在的我来说更像是充当了计算器的角色,曾经数分攒的数仓手艺现在也都作为了我的职业优势,更好的为我自己的分析工作提供支持。
2、 从业务的螺丝钉到引导者
数分接触业务,更像是项目中的一个零件,充当了为业务跑数、搭看板、分析异动的工具性角色,提供的报告结论也多是给运营、产品提供参考,很难直接撬动业务。
我先后在两家公司担任过商分,都有机会自己独立带一个小项目、小产品,可以带着自己的 brd 参与评审,给产品、研发提需,看着自己的项目一点一点从零到一落地,也是非常有成就感的一件事。
有了属于自己的独立项目,正好弥补了数据分析师产出难以量化的致命缺陷,在述职、升职的时候也更有机会,互联网人懂得都懂
3、更强的业务驱动力
对口径一直以来是每一个分析师的痛点,在新的商分团队我们成了口径的制定者,会根据业务的战略目标,制定最合理的口径和核心指标体系,为业务指明增长方向,同时也会给业务团队定制 kpi 目标,直接驱动业务。
最后是分析环节,区别于数分关注具体业务,商分会从事业群甚至集团视角看问题,充当经营分析的角色,通盘考量目前整体业务现状和增长机会点。
Part 2
数分面试必考的指标题,
真没想象那么简单
从大家的提问分同学在自学的过程中把花在 SQL 和可视化等技术层面,对于数据分析工作中最重要最核心的数据指标概念还完全不了解,导致在面试中经常答非所问,包装简历的时候也会闹很多外行笑话,这篇笔记就帮大家梳理数据分析工作中的指标到底是什么,怎么考。
常考题型:
-如果你是某 app 的分析师,最关注什么指标
-如果要分析某某问题,你的思路是什么
-过往经历中印象最深的事、遇到的困难
- AB 测试相关问题
- 搭建看板相关问题(非常重要)
1.指标体系
对于大部分自学的同学来说,指标体系无外乎 DAU 、 GMV 、转化率等,实际工作中远比这些要复杂的多数据分析师要在成百上千的指标中,选择最合适的指标来反应业务的好坏。
以淘宝拉新业务为例,如果老板需要一份日报来查看昨日业务好坏,那日报中可供选择的指标包括
.用户层面:新购物用户数、购频、客单、 ARPU
·流量层面:首次访问用户数、新用户访频、浏览时长、转化率
·留存:次留、3日\7日\次月留存
·交易:新用户订单、 GMV
然而日报中不可能把所有指标全部放下,必须根据实际业务需求,找到最合适的一两个强业务导向指标。如果选择流量相关指标则关注广告投放效果选择留存则关注拉新质量,选择用户则反映拉新数量。
对于很多复杂业务,往往没有现成指标,需要根据情况定义。如直播间引入订单,可以定义为直播间直接下单订单,通过直播间进入店铺后选择其他商品下单、在直播间加购后几日内下单等等,每种定义都能够帮助商家从不同角度进行效果评估。
2.维度:
还是以前文的日报为例,只放新用户数、新用户订单这些指标是远远不够的,无法看出实际拉新效果,还需要展示同比、环比、月至今、季度至今、近7日等时间维度,通过不同维度的对比全方位评估业务效果。
此外,对于很多特殊情况还需要特殊处理
如23年中秋在9月底,22年中秋在9月初如果是电商平台的话,酒类和食品类销售额9月同比会因为时间错峰大幅提升。
如果要看今年9月实际增长就需要剔除中秋错峰影响,这也是分析师经常需要面对和考虑的问题。
3.口径
在指标体系中提到的直播间引入订单就是指标口径的一个经典案例
还是以电商平台为例,如果业务同学直接提需求说要销售额数据,是没办法从底表中跑数的。因为不知道具体是有效订单口径、亦或是成交、出库、妥投、完单等等口径,每个口径对于的销售额、反映的业务情况也完全不相同。
4.面试题案例:
在校招和实习面试是,遇到诸如:实习工作中遇到的困难和解决方法,最印象深刻的事是什么的时候,大家回答与业务侧沟通、掰扯指标口径,通过定义或规范化指标口径为业务准确提供数据支持,是一个很好的加分项
(!!重要)大家在准备可视化相关内容的时候,侧重点不应该是 powerbi 等看板怎么搭建,图表怎么画,这些东西面试官不会关心,更应该注重看板中放哪些指标,什么口径和维度更能反应业务,这才是面试官关注且会考察的内容
Part 3
求职机构不会教的数据分析
SQL必备知识点
很多同学在后台私信提问自学、培训班教的 SQL 和实际应用的区别,这就借助 GPT ,帮大家补齐一些 Spark _ sql 中需要注意的知识点。
1、Spark _ sql 和 Mysql 区别
Spark _ sql 主要用于处理大规模分布式数据,支持分布式计算,而 Mysql 数据存储于关系型数据库中,适合小到中性的应用。同时 Spark _ sql 具有很高的可扩展性,也就是有很多特定的语法函数,但是在大多数时候都是与标准 SQL 一致的。因此对于零基础的同学不用纠结直接刷题就好啦。
2、Broadcast 问题原理及解决方案
这也是一个在 Mysql 中不会遇到,但是实际工作中常见问题。广播场景大概率在 join 过程中,两表一大一小,则可以选择将其广播到每一个节点避免在网络上传输大量数据。图中的报错案例为广播超时,为解决这个问题,可以调节参数增加广播超时时限、优化广播的数据集(这里对应到同学们的 sql 就是限制 join 大小)、增加集群资源等来解决。
这里再给大家补充几个基础概念,尤其是没有工作经验的零基础同学需要了解,可以快速用这些知识点建立优势
3、什么是 Spark _ sql 中的 shuffle
shuffle 是一种分布式计算过程,可以简单理解为 join 、 group by 等的底层原理,其对于 Spark _ sql 调优至关重要。 GPT 给出了合理设置分区、避免不必要的 shuffle 、使用窄依赖、使用广播变量等方法进行 Spark _ sql 调优。
4、什么是数据分区
数据分区是新人必备知识点,是数据存储形式,根据时间、数据范围等等实际需求可以将表分为全量表、增量表、拉链表等类型,篇幅有限,大家可以自行知乎。
Part 4
强推!数据分析师培养业务思维!
必看工具书!!!
金三银四马上始啦,最近后台的咨询也越来越多,主要集中在:
1、考研错过秋招,春招没有实习很难通过面试
2、零基础转行,对数据分析业务模式不了解
3、缺乏数据思维和商业思维,学技术简单,面试一问分析就卡壳...
所有的问题都指向"业务思维、商业思维"
在没有实际工作经验的情况下,如何快速、系统的培养自己对业务的感知是所有零基础同学面临最困难的问题.
这里给大家强推一本全行业适用的小众商业分析思维框架工具书:《算者生存》
全书包括:
3种指标体系(营销、财务、供应)
7类商业模式
8个常见分析方法
13个发现机会的方法
43个常见问题简答
不管是互联网还是传统行业,从战略设计到日常业务运营,都可以在里面找到适合的方法论,所有案例和产品均来自真实企业运营,让你在实践中学习,快速上手。帮助大家充实自己的商业认知,灵活面对面试、实际工作的不同需求。
Part 5
数据分析师太卷拿不到 offer,
试试这几个岗位
数据分析师被各种营销号炒作门槛低,适合自学转行,然而现实情况是这个岗位已经完全饱和,面试除了基本的 sql 、 python ,还需要考察业务经验和数据思维。零基础同学很难再像以前一样轻松入场。
这里给大家再推荐几个暂时还没那么热门的岗位,要求和数据分析类似,可以一同准备,多一些机会和选择。
1、数据运营
岗位技能要求低,与具体业务强相关,适合新人培养业务与数据思维
2、商业分析师
要求商业思维,为业务线整体负责,通常直接向 vp 等汇报
3、经营分析师
把握公司经营方向,制定目标,有财务背景优先,对技能要求不高,需要大局观
4、BI 工程师
需要了解业务指标体系,对 hive 、数仓要求高,适合技术岗转行
以上岗位和数据分析要求类似,在业务和技术上各有侧重,同学们可以根据自己的情况选择,求职时也能多一次机会。数据相关的岗位还有很多,尤其是目前热度较高鱼龙混杂。
更多精彩信息请大家移步到小红书关注【Lii】小哥哥!
很多小伙伴在lala陪伴下拿下投行、咨询、互联网、四大等的日常实习/暑期/秋招offer呢!
我们的辅导内容主要包括定制化专属导师1v1辅导、无限次Mock模拟面试、简历修改、项目复盘、笔试讲解
此外!还会有全平台视频录播课程及笔试面试真题题库分享,也还会有辅导老师和专属jd定制服务!欢迎详细咨询了解~
往期精彩
实习图鉴专区
lala雇主品牌合作通道开放啦
欢迎招聘负责人扫码加微信沟通!
备注【招聘合作+公司】期待垂询
高质量实习机会看这里!!
想获得高质量实习refer机会吗?
添加lala小助手小可爱,可获得日均100+条实习信息