pycaret学习笔记（6）-quickstart-时间序列

文摘 2024-11-15 00:00 北京

时间序列

PyCaret时间序列模块是使用机器学习和经典统计技术分析和预测时间序列数据的强大工具，该模块通过自动化从数据准备到模型部署的整个过程，使用户能够轻松执行复杂的时间序列预测任务。

PyCaret时间序列预测模块支持ARIMA、Prophet和LSTM等广泛的预测方法，它还提供各种功能来处理缺失值、时间序列分解和数据可视化。

Setup

此函数初始化训练环境并创建转换管道。在执行任何其他函数之前，必须调用设置函数。

# load sample dataset
from pycaret.datasets import get_data
data = get_data('airline')

Functional API

from pycaret.time_series import *
s = setup(data, fh = 3, fold = 5, session_id = 123)

OOP API

from pycaret.time_series import TSForecastingExperiment
s = TSForecastingExperiment()

比较模型

该函数使用交叉验证训练和评估模型库中所有可用估计器的性能。该函数的输出是具有平均交叉验证分数的评分网格。CV期间评估的指标可以使用get_metrics函数访问。可以使用add_metric和remove_metric函数添加或删除自定义指标。

# functional API
best = compare_models()

# OOP API
best = s.compare_models()

Analyze Model

# functional API
plot_model(best, plot = 'forecast', data_kwargs = {'fh' : 24})

# OOP API
s.plot_model(best, plot = 'forecast', data_kwargs = {'fh' : 24})

# functional API
plot_model(best, plot = 'diagnostics')

# OOP API
s.plot_model(best, plot = 'diagnostics')

# functional API
plot_model(best, plot = 'insample')

# OOP API
s.plot_model(best, plot = 'insample')

预测

# functional API
final_best = finalize_model(best)
predict_model(best, fh = 24)

# OOP API
final_best = s.finalize_model(best)
s.predict_model(best, fh = 24)

保存模型

# functional API
save_model(final_best, 'my_final_best_model')

# OOP API
s.save_model(final_best, 'my_final_best_model')

載入模型到環境

# functional API
loaded_model = load_model('my_final_best_model')
print(loaded_model)

# OOP API
loaded_model = s.load_model('my_final_best_model')
print(loaded_model)

最新课程-基于R语言的动态预测模型课程-胖子老师独自授课

开课目的及前言

预测模型作为真实世界研究的重要组成部分，其研究被广泛开展。但是，传统的预测模型利用基线数据对最终的生存结果进行预测，这种模型无法纳入患者在后续随访中可能会动态变化的重要数据（比如肿瘤标记物的动态变化）。以上情况在统计学中会产生估计偏差情况，也是不符合临床实际的。近年来发展起来的动态预测模型方法，利用患者的多次随访数据，结合患者的基线数据，对最终患者的额生存结果（或类似的time to event事件）进行估计。其发文量呈现快速增长趋势。

在临床实际中，医生会根据患者的动态变化指标做出进一步诊断及治疗的判断。动态预测模型结合患者的纵向数据与最终的生存结果，对于最终结果进行更加准备的预测。由于当前R语言在医学统计工作中占据重要地位，但很多临床大夫、护士因为时间工作关系很难将R语言与临床科研相结合，故开设R语言动态预测模型课程，旨在快速让学员掌握统计工作中常用到的R语言，助力临床科研工作。天企助力(天津)生产力促进有限公司特举办“基于R语言的动态预测模型课程培训班”。

预测模型类文章目前总结起来发展经历了以下三个阶段：

基于传统流行病学的列线图模型（本质都是cox回归及glm回归），简单的统计学分析模型，是模型依赖的方法，临床上实际情况很难满足其前提假设，实际效果不好。
基于机器学习/深度学习的预测模型的构建（在数据上提高了维度，在算法上引入了机器学习），虽然算法上引入了机器学习模型，处理数据更加灵活，模型的假设也更少。但是在使用的数据上还是患者的一次基线数据进行预测，与临床实际不符。
基于纵向数据的动态预测模型（基于纵向多次随访数据，模型应用联合模型等动态预测模型方法），应用患者的多次随访数据对最终的生存结果进行预测，从数据和方法上都更类似于临床实际。

考虑到动态预测模型有以下特点，因此必然是后续高分文章的必备方法：

数据上必须有同一个患者的多次随访数据，相对于既往横断面一次基线数据，数据的收集难度更大，而且动态预测模型需拟合纵向的线性混合模型，因此需要的数据量较大。这就提示我们如果能收集到如上数据更加容易发高分文章。
应用方法学动态预测模型需首先掌握普通生存分析及普通预测模型的方法，并且还需要熟悉纵向数据分析的广义线性混合模型，再次基础上还需要掌握tidyverse语法基础来将自己的数据转换为满足函数要求的纵向数据，另外对于联合模型，模型的结合形式及变量选择也均需要从临床背景及统计学方法考虑。

近期高分文章举例

授课老师

灵活胖子-独自

双一流学校肿瘤学博士毕业，目前就职于国内五大肿瘤中心之一。科研方向为真实世界研究，生物信息学分析及人工智能研究。目前以第一或共同第一作者身份发表SCI论文10余篇，累计IF50+。目前与国内多个院校及医院有科研合作。联合翻译小组同学，在国内第一次将jmbayes2及dynamicLM全文翻译为中文并在公众号发表。

课程目录及安排

授课形式及时间

授课形式：远程在线实时直播授课。

授课时间：2024年12月开课，总课时不少于30小时，每周进行3-5小时的授课，有充分时间学习，预计6-8周完成所有授课内容。

答疑支持：建立课程专属微信群，1年内课程内容免费答疑。

视频回看：3年内免费无限次回看。

课程售价及售后保证

课程售价：总价3000元，报名可先交300元预定即可，开课后2周内交齐即可

对公转账等手续务必提前联系助教

承办公司：天企助力（天津）生产力促进有限公司

奖励政策：学员应用所学内容发表IF 10+文章可退还学费（具体要求及流程需要咨询助教）

报名咨询

可联系我的助教进行咨询

助教联系电话：18502623993

正式通知

pdf版通知可联系助教获取

灵活胖子的科研进步之路

医学博士，R语言及Python爱好者，科研方向为真实世界研究，生信分析与人工智能研究。

最新文章

数据可视化

数据处理

Cursor的python语言配置-基于anaconda

整洁数据在R语言中的要求

Cursor的R语言配置-本地实操截屏步骤版

tidyplots学习超详细注释版-基于Cursor-(4)

12月15日开课-动态预测模型

Cell主刊文章超详细解读及代码注释-基于Cursor

第40期分享会-1区动态预测模型文章解析

tidyplots学习超详细注释版-基于Cursor-(3)

tidyplots学习超详细注释版-基于Cursor-(2)

tidyplots学习超详细注释版-基于Cursor-(1)

课程更新-应用Cursor进行代码编写演示

Cursor 的基本用法-R语言实战版

第39期分享会-算力平台介绍及AI辅助编程体会

外网第一AI辅助IDE-Cursor配置R语言环境(实操总结)

lcmm(2)-如何使用hlme函数估计潜在类别混合模型-2

lcmm(2)-如何使用hlme函数估计潜在类别混合模型-1

pycaret学习笔记（6）-quickstart-时间序列

第38期分享会-动态预测模型文章分享-联合法模型

肌少症文献计量学分析

应用潜类别分析扩展混合模型体系-lcmm（1）：introduction&get started

pycaret学习笔记（5）-quickstart-异常值检测

50分肿瘤学年鉴文献分享-乳腺癌的动态预测:利用TEAM试验在临床实践中证明动态预测模型的可行性

动态预测模型文献分享-血小板计数作为感染患者住院死亡率的动态预测标记

第37期公开课-临床结构化数据整理及科研选题

目标仿真试验的基本原理、设计要素及其优缺点

动态模型文献分享-通过纵向D-二聚体分析动态评估癌症患者静脉血栓栓塞风险：一项前瞻性研究

冰冷的临床数据背后，是一个个活生生的个体

西柚仓库集合

第36期公开课-肿瘤学年鉴（IF 50）文献动态预测模型方法学分享

pycaret学习笔记（3）-quickstart-回归任务

pycaret学习笔记（2）-quickstart-分类任务

给pandas带来tidyverse的力量！-tidyversetopandas教程(3)

给pandas带来tidyverse的力量！-tidyversetopandas教程(2)

pycaret学习笔记（1）-整体介绍及安装

胖子老师独自授课-基于R语言的动态预测模型课程

给pandas带来tidyverse的力量！-tidyversetopandas教程(1)

应用bibliometrix包进行文献计量学（四）

conda使用教程

IF=30.8：COX+竞争风险+XGBOOST+神经网络=预测英国普通女性10年癌症死亡率风险

第35期公开课-基于Python机器学习文献解读及实操演示

应用bibliometrix包进行文献计量学（三）

应用bibliometrix包进行文献计量学（二）

应用bibliometrix包进行文献计量学（一）

文献计量学的一体化解决方案-bibliometrix包（slides-1）

第34 期分享会-也来谈谈贝叶斯

bulk+单细胞+热点文章套路分享学习-bulk和scRNA揭示肝细胞癌中的细胞异质性和免疫浸润(一)

DEPTH2-基于表达谱的肿瘤异质性分析

IOBR2：转录组数据预处理

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉