R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化

科技   科技   2024-10-10 16:57   浙江  

全文链接:https://tecdat.cn/?p=32981


气候变化和空气污染对现代社会产生了越来越大的影响。在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要点击文末“阅读原文”获取完整代码数据

相关视频


为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的工具。

长沙作为湖南省的省会城市,其气象条件和空气质量一直备受关注。通过分析长沙地区的气象数据、空气污染指标和PM2.5浓度,可以更加全面地了解该地区的空气质量状况,并揭示气象因素对其变化的影响。

本研究旨在使用R语言中的广义加性混合模型(GAMM)方法,帮助客户来探索长沙地区气象因素与空气污染之间的关系,并进一步研究它们对PM2.5浓度变化的影响。我们将采集长沙地区的逐日气象数据、空气污染指标以及PM2.5浓度数据,应用GAMM模型进行分析。

在分析过程中,我们将考虑多种气象因素,如温度、湿度、风速等,并结合空气污染指标,如PM10、SO2、NO2等,来建立相应的GAMM模型。通过显著性检验,我们将评估各个因素对PM2.5浓度的影响程度,并进一步进行逐日变化的可视化分析,以呈现其动态变化规律。

查看数据

读取数据


airquality=read.csv("长沙气象站逐日气象+空气污染 数据.csv")

Region=read.csv("长沙市年各个站点的PM2.5 每日浓度.csv",skip=1)

Table 2. Significance tests of PM2.5levels for different season, region, daytime and day of week. 对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。

这段内容提到了对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。显著性检验是一种统计方法,用于确定两个或多个样本之间是否存在显著差异。

在这个情境中,研究人员可能希望了解不同季节、地区、白天和周日的PM2.5水平是否存在显著差异。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它对人体健康和环境质量有重要影响。

为了进行显著性检验,研究人员可能会收集来自不同季节、地区、白天和周日的PM2.5水平数据,并使用统计方法来比较这些数据。常用的显著性检验方法包括t检验、方差分析和卡方检验等。

通过进行显著性检验,研究人员可以确定不同季节、地区、白天和周日的PM2.5水平是否存在显著差异,从而为环境保护和公共健康管理提供重要的科学依据。

Season

 
kruskal.test(PM2.5.ug.m3. ~ Season, data = airquality)

Region

Daytime

Season

pairwise.t.tes=="summ

Region

Day of week

Weekends1=seq(3,nrow(airquality),by=7)  

Weekends2=seq(4,nrow(airquality),by=7)

wilcox.test( airquality$PM2.5.ug.m3.[airquality$Weekends==0] , airquali


点击标题查阅往期内容


R语言气象模型集成预报:神经网络、回归、svm、决策树用环流因子预测降雨降水数据


左右滑动查看更多


01

02

03

04



Fig 3. Day to day variations of PM2.5in different seasons, 不同季节PM2.5的逐日变化

不同季节PM2.5的逐日变化指的是在不同季节中,每天空气中PM2.5浓度的变化情况。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它们可以悬浮在空气中并被人们吸入。PM2.5来源于工业排放、交通尾气、燃煤、木材燃烧等。

在不同季节中,PM2.5的逐日变化可能会有所不同。一般来说,春季和夏季的PM2.5浓度相对较低,而秋季和冬季的PM2.5浓度相对较高。

在春季,天气温暖,风力较大,降雨较多,这些因素有助于减少空气中的PM2.5浓度。此时,植物生长活跃,能够吸收大量的二氧化碳和颗粒物,从而净化空气。

夏季的PM2.5浓度一般较低,主要是因为高温和强烈的阳光可以加速颗粒物的分解和扩散。此外,夏季也是降雨量较多的季节,雨水可以洗刷空气中的颗粒物。

秋季的PM2.5浓度开始上升,主要是因为天气变冷,大气稳定,风力较小,这有利于颗粒物的积累。此外,秋季还是农作物收获季节,农田燃烧残留物会释放出大量的颗粒物。

冬季是PM2.5浓度最高的季节。在冬季,天气寒冷,大气层稳定,风力较小,这导致颗粒物在空气中滞留时间较长。此外,冬季是取暖季节,燃煤和木材燃烧释放的颗粒物也会增加。

总的来说,不同季节PM2.5的逐日变化受到多种因素的影响,包括气温、风力、降雨量、植物生长和人类活动等。了解这些变化有助于我们采取相应的措施来减少PM2.5的污染。

points(which(airquality$Season=="spring" & airquality$Weekends==1),airq

不同季节PM2.5的逐日变化 Diurnal variations of PM2.5in different months

不同季节PM2.5的逐日变化是指在不同季节中,每天PM2.5浓度的变化情况。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它们对人体健康有害。这些颗粒物主要来自于工业排放、交通尾气、燃烧过程和自然来源等。

在不同季节中,PM2.5的逐日变化可能受到多种因素的影响。例如,冬季由于采暖需求增加,燃煤和燃气的使用量增加,导致PM2.5浓度较高。而夏季由于气温升高,光化学反应增多,加上交通尾气和工业排放的贡献,PM2.5浓度也可能较高。

此外,气象条件也会对PM2.5的逐日变化产生影响。例如,风速、风向、降雨等天气因素都会影响PM2.5的扩散和沉降,从而影响其浓度。

因此,不同季节中PM2.5的逐日变化是一个动态的过程,受到多种因素的综合影响。通过对这种变化的研究和监测,可以更好地了解和应对空气质量问题。

grep( date,airquality$日期)),]$PM2.5.ug.m3.  
plot(Mar,type="p",col=j,ylab="95% CI")

3-5月份

6-8月份

9-11 月份

12-2 月份

Correlation coefficient and COD versus distance between the stations 相关系数和COD随站间距离的变化

相关系数是用来衡量两个变量之间的线性关系强度和方向的统计指标。它的取值范围在-1到1之间,其中1表示完全正相关,-1表示完全负相关,0表示无相关性。

相关系数和站间距离的变化之间可能存在一定的关系。如果两个变量之间的相关系数较高(接近1或-1),则说明它们之间存在较强的线性关系。在这种情况下,站间距离的变化可能较小,因为变量之间的关系比较稳定。相反,如果两个变量之间的相关系数较低(接近0),则说明它们之间的线性关系较弱或不存在。在这种情况下,站间距离的变化可能较大,因为变量之间的关系较为不稳定。

abline(lm(cordata~distdata),col="red")

GAMM模型分析温度 、湿度、风速、能见度、气压对PM2.5的影响

GAMM(Generalized Additive Mixed Models)是一种灵活的统计模型,结合了广义可加模型(GAM,Generalized Additive Models)和混合模型(Mixed Models)的优点。它可以用于解决包含非线性关系和随机效应的数据建模问题。


点击标题查阅往期内容


R语言广义相加模型 (GAMs)分析预测CO2时间序列数据


左右滑动查看更多


01

02

03

04



GAMM模型主要用于处理长期观测数据和重复测量数据,其中数据可能受到时间、空间或其他相关因素的影响。GAMM模型具有以下特点:

  1. 广义可加模型(GAM)的优点:GAM模型可以通过非线性平滑函数来建模解释变量与响应变量之间的复杂关系,适用于非线性关系的建模。

  2. 混合模型(Mixed Models)的优点:GAMM模型可以处理数据中的随机效应,比如个体间的差异或层级结构中的变化。

  3. 可解释性:GAMM模型通过可加函数模型来描述数据,可以直观地解释模型中的每个平滑项的效应。


gamm(PM2.5.ug.m3.~s(平均温度.摄

summary(b$gam) # gam style summary of fitted model

simple checking plots 模型检验

用AR1残差项拟合模型

lme拟合的细节

拟合模型的Gam风格总结

模型检验




本文中分析的数据、代码分享到会员群,扫描下面二维码即可加群! 




点击文末“阅读原文”

获取全文完整代码数据资料


本文选自《R语言广义加性混合模型(GAMM)分析长沙气象、空气污染、PM2.5浓度、显著性检验、逐日变化可视化》。




点击标题查阅往期内容

【视频】广义相加模型(GAM)在电力负荷预测中的应用
分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测
实现广义相加模型GAM和普通最小二乘(OLS)回归
R语言非参数模型厘定保险费率:局部回归、广义相加模型GAM、样条回归
R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图
R语言广义相加(加性)模型(GAMs)与光滑函数可视化
R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测
R语言中的多项式回归、B样条曲线(B-spline Curves)回归
R语言广义相加模型 (GAMs)分析预测CO2时间序列数据
R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归
在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
Python用广义加性模型GAM进行时间序列分析
R语言广义线性模型GLM、多项式回归和广义可加模型GAM预测泰坦尼克号幸存者
R语言中的广义线性模型(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口
R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归



拓端数据部落
拓端(tecdat.cn)创立于2016年,提供专业的数据分析与挖掘服务,致力于充分挖掘数据价值。
 最新文章