关注SPSSAU
数据分析 简单一点
论文问卷 快人一步
科研统计图
SPSSAU出品 · 必属精品 · 建议收藏
↓↓↓↓↓↓↓↓
数据分析结果常以可视化形式呈现,其中统计图扮演着重要角色。这种图形化表达方式能清晰展示数据特征,包括分布情况、变化趋势和内在联系。在学术研究中,我们经常遇到各种统计图表,这些图表不仅便于读者快速把握信息要点,还有助于研究者发现数据中隐藏的模式和独特之处。接下来,我们将详细探讨科研领域常用的20多种统计图表。
统计图可以帮助人们快速地理解和分析数据,找出其中特征和变化规律。在科学研究中一些常用统计图适用情况和举例说明如下:
下面以SPSSAU输出的统计图为例,详细介绍这20类统计图的使用场景及图形示例。
散点图用于考察定量数据之间的关联关系,即查看X和Y之间的关系情况。散点图通常用于探索性研究,直观展示出数据间的关联关系情况。(2) 回归分析后模型检验,查看残差分别与自变量间的关联性【回归模型假定残差不应该与自变量有关联性,即异方差性】。
直方图用于直观展示数据分布情况,观察数据的正态分布特性,检验数据是否满足正态性。(2) 回归分析后模型检验,将残差进行正态性检验,如果残差呈现出正态性意味着模型构建良好,反之说明模型构建较差。(3) 其他用于查看数据分布、检验正态性的场景等等。箱线图(也称盒图,箱盒图等)是在1977年由美国统计学家John Tukey发明,分析数据需要为定量数据。通过箱线图,可以直观的探索数据特征。(2) 非参数检验时查看不同类别X时,Y的数据分布情况;词云图是由美国西北大学新闻学教授Rich Gordon提出,“词云”可对文字中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而使浏览者只要一眼扫过文本就可以领略文本的主旨。点击下方链接查看词云图帮助手册:
词云图
误差线图用于展示数据的不确定性程度,显示潜在的误差或每个数据标志的不确定程度。样本数据的波动是通过标准差体现,因而样本均值不确定性程度为标准差。
点击下方链接查看误差线图帮助手册:
误差线图
P-P图和Q-Q图常用于直观查看数据是否正态分布。P-P图和Q-Q图的目的性基本一致,但原理上有着区别。(1) 方差分析对应的Y值是否具有正态性特质的判断;(2) 回归分析前,对应的Y值是否具有正态性特质判断;回归分析后,使用P-P图和Q-Q图检查残差值是否有正态性特质;(3) 二元Logit回归后的残差值是否有正态性特质。
点击下方链接查看P-P图/Q-Q图帮助手册:
P-P图/Q-Q图
ROC曲线,也称受试者工作特征曲线;ROC曲线最初是运用在军事上,当前在医学领域使用非常广泛,用于研究X对于Y的预测准确率情况。点击下方链接查看ROC曲线帮助手册:
ROC曲线
象限图可对数据分类进行直观展示;使用水平和垂直分割线将图表区域划分成四个象限,而且每个象限呈现对应的数据。通常情况下,象限图呈现目的在于直接展示数据划分区域。
点击下方链接查看ROC曲线帮助手册:
象限图
帕累托图是“二八原则”的图形化体现,80%的问题是由20%的原因所致;通常情况下帕累托图可用来展现某‘问题’的占比情况,通过图形找出最重要的原因。
点击下方链接查看帕累托图帮助手册:
帕累托图
从展示的图形类型上,簇状图可分为簇状折线图、簇状柱形图和簇状条形图等,SPSSAU默认均提供;SPSSAU共提供平均值、计数、求和以及中位数四种汇总值。簇状图时,分类数据为0个,1个或2个,SPSSAU均提供对应的图形展示。点击下方链接查看簇状图帮助手册:
簇状图
组合图用于两类维度值之间有较大差异时的图形化展示,其有两个坐标轴,分别是主轴和次轴,通常情况下,主轴为数量较大项,次轴为数量较大项。比如展示GDP与GDP增长率,主轴为GDP,次轴为GDP增长率。气泡图可用于展示X和Y之间的关系情况,并且利用Z标识每个点的气泡大小。同时,SPSSAU支持直接在气泡中展示‘标签’,并且可使用不同颜色标识气泡。
点击下方链接查看气泡图帮助手册:
气泡图
核密度图是一种非参数检验方法,其是对直方图的进一步抽象化,但其更加直观,其曲线下面积为1,通常用于连续数据的直观展示,比如年龄的分布情况,身高的分布情况等。点击下方链接查看核密度图帮助手册:
核密度图
小提琴是是箱线图和核密度图的集合,其可通过箱线思维展示数据的各个百分位点,与此同时,还可使用核密度图展示数据分布的‘轮廓’效果,‘轮廓’越大,即意味着数据越集中于该处,反之则说明该处时数据越少。饼图(或圆环图)用于直观展示数据中各部分占比的大小关系,适合展示分类变量的相对比例,例如不同产品销售占比或市场份额分配情况。碎石图是一种用于因子分析或主成分分析的图表,其主要作用是帮助分析者确定保留多少个因子或主成分。图中横轴通常表示因子(或主成分)的数量,纵轴表示每个因子的特征值。通过观察特征值的变化趋势,特别是其变化的拐点或“碎石”,来决定保留哪些因子以解释数据中的变异性。堆积柱状图是一种用于比较分类数据的图表,它将不同类别的数据堆积在同一个柱状图上。每个柱状图的高度代表整体的大小,而柱状图内的各个段则表示不同类别的份额或部分占比。这种图表特别适合展示不同类别在总体中的比例变化。coefPlot图通常指的是系数图,在统计建模中经常用于显示各个解释变量(自变量)的系数估计值及其置信区间。这种图表帮助分析者直观地了解每个变量对因变量(目标变量)的影响程度和方向。相关分析热力图用于直观显示多个变量之间的相关性强度和方向。通常,热力图通过颜色编码展示相关系数的大小,其中颜色深浅表示相关性的强弱,颜色的正负表示相关性的方向(正相关或负相关)。这种图表帮助分析者快速理解变量之间的关联关系。聚类树状图能够直观地展示基于相似性或距离的数据层次聚类结果,是一种用于展示数据之间层次关系的图形工具,常用于数据分析和生物信息学领域。它通过递归地将数据分组并逐步合并,形成一个树状结构,以显示数据对象之间的相似性或距离。使用聚类树状图可以帮助研究人员识别数据中的自然群体或分类。
科研论文中的统计图一般包括5个部分:分别是标题、横标目、纵标目、刻度、图例。具体的说明以及注意事项如下:
举例:下图为在一篇文献中截的一个统计图,大家可以参考:
每种类型的统计图的特点不同,所呈现出数据的主要特征也不尽相同,建议结合数据类型选择合适的统计图进行搭配,不同的数据类型,适用不同的统计图。
数据可分为定类数据和定量数据两大类,按照X和Y的思维,先识别出X和Y分别的数据类型情况,然后找到适合的统计图作图即可,X与Y组合起来常用的图形见下表:
- 举例说明:比如想要分析不同品种和不同施肥方式下,水稻产量的差异,希望通过图形直观展示差异情况。很明显这里2个X均为定类数据,而水稻产量为定量数据,所以可以使用“簇状图”进行可视化分析。
将数据上传至SPSSAU系统,选择“簇状图”,拖拽变量至右侧相应分析框,操作如下图:
在使用SPSSAU进行数据分析时,选择相应方法进行分析得到分析结果的同时,SPSSAU会默认自动输出对应的统计图分析结果,以及该方法可能涉及的各类统计图。
比如使用SPSSAU进行方差分析、t检验等差异性分析方法会自动输出对应的折线图、柱形图等;多选题分析时会自动输出对应的响应率、普及率、帕累托图、交叉汇总图等;回归模型包括线性回归、路径分析、结构方程模型、调节中介等都会自动输出对应的模型图。
举例说明1:进行调节作用分析时,SPSSAU会自动输出对应的简单斜率图,如下图:举例说明2:使用探索性因子分析时,SPSSAU默认输出对应的碎石图和载荷图,如下图:
举例说明3:构建结构方程模型时,SPSSAU自动输出对应的模型图,如下图:
提示:SPSSAU可视化结合了数据分析方法的思想,默认提供准确的可视化图形展示,这是SPSSAU智能系统的一个组成部分。通常自动输出的第一个统计图是最优的即最合适的。
SPSSAU当前提供字体、字号、小数位、是否隐藏标签、是否展示Y轴、Y轴颜色设置以及七类色彩风格设置,该设置只需要在任何一个地方设置,后续和其它全部的图都会基于该设置生成‘可视化图’,不需要重复进行设置。
在SPSSAU输出的统计图下方,点击Aa样式进行设置,如下图:
SPSSAU又来送会员啦
点赞+在看+在评论区留言分享
“使用SPSSAU完成科研论文写作or发表”的经历
截止2024年7月29日10:00
留言点赞前18名
赠送SPSSAU日会员抵扣码
若要了解数据分析方法相关的更详细知识,可进入SPSSAU官网查看帮助手册or联系智能客服or人工客服为您解答。
以上就是今天的全部内容啦~
若您想看其他干货内容
请在评论区告诉SPSSAU