一、散布图定义:
又名散点图或相关图,由XY两个变量间的相关关系的探讨,用相关分析的统计方法可求得其相关系数r的大小,由相关系数r的大小可判断两个变量间的相关程度。这就是所谓大数据下AI应用的基本逻辑。
另一种简单的方法就是将XY两个变量的测定值绘制成散布图,依其点子的分布情形及趋势来判断XY两个变量的相关程度。
二、散布图的构成
(1)从散布图可简单容易判断X与Y两个变量间:
○是否有相关关系。
○相关关系的强弱。
○是正相关或者负相关。
○是直线相关或是曲线相关。
(2)从散布图上可简单容易判断数据是否有异常趋势或
是有没有必要作层别分析。
(1)验证两个变量间的相关关系。
(2)掌握要因对特性的影响程度
1 相关系数不等于因果关系。
2 绘制散布图后进行判定结果为「无关」,系指在该数据区间内而言无关,无法进一步推断到区间外的结果。
3 要善用层别法工具分析。
4 离群值的影响,是否会为异常值的检讨。
5 曲线相关无法用符号判定来检讨。
6 检讨因果关系时,通常以X代表因,Y代表果。
2002年某工厂温度(X)与瞬间停机台数(Y)之调查结果如下
(1) (Ⅰ+Ⅲ)>(Ⅱ+Ⅳ)=(5+9)>(1+5)
可初判断温度与停机台数有正相关系
(2) 即温度升高停机台数相对增加。