数据分析必会知识点1:概率与统计基础

文摘   2024-06-27 09:05   新疆  

本公众号集结了多位一线数据分析者的经验和案例,可以通过传送门标签进入阅读:

入门数据分析思维

进阶数据分析思维
进阶技能
职场经验
AI
接下来将会分为几篇给大家介绍下数据分析必懂的一些统计学知识点,大家可以根据这几篇文章来补充自己的统计学知识。本篇先来介绍概率论与数理统计的一些名词。


三门问题,救救我?

有一百扇门,只有一扇门里有一辆车,其他九十九个是空的,你现在选了第一扇门,别人给你开了后面九十八个,都是空的,那你现在换不换第一百扇门。

答案在这里:

总而言之,贝叶斯定律是跟据先验概率和新的证据(或数据)来计算后验概率,用于在获得新信息时更新假设的概率。

2 随机变量

随机变量是概率论中的一个核心概念,用于描述随机试验结果的数学变量。其取值不是确定的,而是依赖于随机试验的结果。

(1)定义:随机变量𝑋是对随机试验结果的数值描述,其取值依赖于随机试验的结果。随机变量通常用大写字母表示,如X,Y,Z等。

(2)类型:

离散随机变量:如果随机变量只能取有限个或可数个数值,则称为离散随机变量。例如,掷一枚六面骰子,出现的点数就是一个离散随机变量,其可能取值为1, 2, 3, 4, 5, 6。

连续随机变量:如果随机变量在某一区间内可以取无穷多个数值,则称为连续随机变量。例如,人的身高、体重等就是连续随机变量。

(3)性质:

研究随机变量,一般需要研究随机变量的概率分布、期望和方差:

*概率分布*:随机变量的概率分布描述了其取各个可能值的概率。对于离散随机变量,通常使用概率质量函数(PMF)来描述;对于连续随机变量,通常使用概率密度函数(PDF)来描述。
*期望(Expected Value)*:随机变量的期望是其可能取值的加权平均,反映了随机变量的平均水平。
**方差(Variance)**:随机变量的方差描述了其取值与期望之间的偏离程度,反映了随机变量的波动情况。

梅花机 (shuxuele.com)


-END-
领资料
数据禅心是一个数据分析职业者联盟,分享交流工作经验和心得,关注公号有免费资料畅领(领取方法:点击“阅读原文”)。
数据分析+数据产品经理->能力模型和测评;
战略工具箱+思维模型->助力顶层思维设计;
数据分析+统计学+因果推断 ->提升分析技能功底;
Python+机器学习 ->进阶分析技能开挂;
数据分析成长路径 ->知晓路在哪里;
1on1陪跑
数据禅心还是一个职友互帮互助的组织,超十年工作经验的数据分析师/科学家/数据产品经理/总监作为“陪伴教练”,为陷入迷茫的各位职场人答疑解惑,帮助各位走出泥潭,实现个人成长,甚至迎来职业跃迁。如果你有任何职场上的问题,欢迎来找我们沟通。每个来沟通的职场人都会赠送半小时的咨询~抓住机会来撩吧(文末扫二维码“意向搜集”)~
我想转行到数分,不知道学什么?
我不知道我未来的职业规划是什么?
总是在基层,我还有机会晋升么?
我想跳槽,但不知道要不要跳?
我简历不太行,没有信心?
我没啥项目经验,怎么包装?
我总觉得自己价值发挥不出来,怎么办?
...

请扫码填写报名意向:

体系化学习
数据禅心我们几位数据分析师,结合自己在职场中的成长经验,将数据分析经验整理成了两个训练营,一个是入门训练营,适合-1~3年数分,以及转行/小白;一个是进阶训练营,适合3年左右需要提升的数据人。具体课程可以扫码,或点击“原文链接”查看:
数据分析师能力模型&测评
另外,组织也新发布了《数据分析师能力模型&测评》,大家可以点击下方传送门,了解能力模型,并且做免费测评~优秀的数据分析师都需要什么能力?
如果对你有用,点个“喜欢”再走吧~

数据禅心DataZen
人人都是数据分析师;从思维到技能,在这里你能系统学习到数据分析知识;从面试到加薪,在这里你能获得来自互联网大厂的加持。 关注我们,陪你一起升职加薪!