刷新历史!"寒门学子"十年磨一剑,在机器学习技术助力下频发时间序列顶会!

文摘   2024-09-26 09:00   上海  

前沿背景

在数据驱动的决策时代,时序预测技术对于理解并预测未来趋势至关重要。本课程深入探讨了机器学习和深度学习在时序数据分析和预测中的应用,特别关注于算法的数学原理、模型架构和实际应用场景。

课程首先将会讲解时序分析的统计基础,包括自回归模型(AR)、移动平均模型(MA)和自回归移动平均模型(ARMA)。随后,我们将引入机器学习技术,如支持向量机(SVM)、k-最近邻(KNN)和随机森林(RF)等,并讨论它们在时序预测中的特定应用。

随着课程的深入,我们将重点转移到深度学习领域。深度学习模型,尤其是循环神经网络(RNN)和其变体长短期记忆网络(LSTM),在处理序列数据时展现出了卓越的能力。我们将详细讲解这些模型的工作原理、优化策略和编码实现。

课程内容还包括了卷积神经网络(CNN)在时间序列预测中的创新应用,以及如何使用注意力机制和Transformer模型来捕捉长距离依赖关系。此外,课程将涵盖模型的超参数调优、正则化技术以及如何评估预测模型的性能。通过本课程,学员将能够深入理解时序预测的高级技术,并掌握将这些技术应用于实际问题的能力。


课程目标(完全适合零基础)

1. 掌握技术基础

本课程旨在为学员提供坚实的时序预测技术基础。学员将学习到时序分析的统计学原理,包括时间序列的分解、平稳性检验和自相关函数等基本概念。此外,课程将深入讲解机器学习算法,如线性回归、决策树、随机森林等,以及它们在时序数据上的应用策略。

2. 培养分析能力

通过对各种时序预测模型的学习,学员将培养出强大的数据分析能力。课程将教授如何对时序数据进行预处理、特征提取和特征选择,以及如何评估和优化模型的性能。学员将学会使用交叉验证、AIC和BIC等统计方法来评估模型的拟合度。

3. 紧追科技前沿动态,扩宽视野

随着技术的快速发展,后续课程将不断更新,以确保学员能够接触到最新的研究和行业实践。学员将学习到如何使用最新的深度学习框架,如TensorFlow和PyTorch,来构建和训练复杂的时序预测模型。鼓励学员使用循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)等模型来完成不同类型时序数据的处理及预测工作。

4. 实战案例分析

课程将通过一系列实战案例来加强学员的实践能力。这些案例将涵盖金融、气象、医疗和销售等领域,使学员能够在实际情境中应用所学知识。通过分析真实的数据集,学员将学会如何设计解决方案,解决实际的预测问题。

5. 编程技能提升

在本课程中,学员将通过编程实践来提升自己的技术技能。无论是使用Python进行数据清洗和分析,还是使用特定的机器学习或深度学习库来构建模型,学员都将在实践中不断提高自己的编程能力。

6. 培养创新思维

课程鼓励学员发展创新思维,通过探索不同的模型结构和参数配置来寻找最优的解决方案。学员将学会如何根据问题的特性调整模型,以及如何创新地结合不同的技术来提高预测的准确性。

课程老师

主讲老师来自国内著名高校,就职于顶尖企业,擅长基于机器学习及深度学习进行分类、预测及语义理解分析研究。近年来发表国内核心及EI论文10余篇,研究方向包括异常目标检测(CenterNetYOLO框架、Mask R-CNN)、行业客户分群预测(RFSVMCNN)、高精度语义理解(TransformerLSTM等。

时序预测分析详细目录

第一天python编程基础及实战演练

1、python编程基础

  Python简介,了解Python的发展历史、特点、现状及版本情况,并与其他编程语言进行分比较。

  快速安装和设置Python环境:基于Windows和Mac环境下载安装 Python3,搭建Python3的运行环境。讲解Anaconda及Pycharm的优缺点,配置基础环境,并运行第一个Python程序。

  Python的基础知识:主要讲解python的基础知识,例如python编写规范、python中常量、变量和数据类型的定义、python中的内置函数、如何定义和调用函数、函数如何传参、递归函数、正则表达式等。

2、数据分析及可视化

  python第三方依赖包:主要介绍python第三方依赖包在编程流程中的作用及应用场景,例如pandas、numpy、matplitlib、scikit-learn、pytorch、SQLAlchemy、NLTK、Jieba等。

  Pandas:使用 Pandas 进行高级的数据分析操作,包括如何去做数据清洗、预处理和排序等数学计算,数据的分箱技术,分组技术,聚合技术,以及透视表等。

  numpy:使用numpy进行数据计算,包括多为数组和矩阵运算,例如创建数组的方式、数组数据类型、多维数组、数组索引和切片、random模块及通用函数等。

  数据可视化:Matplotlib的简介及基本使用方法。包括安装及如何快速使用matplotlib绘图、matplotlib的绘图基础、图像元素设置、绘图风格定义及结果保存等。

实战案例:5Python实战案例(难度由浅入深,待定)

第二天:机器学习和深度学习基础

1、机器学习算法

  机器学习简介:了解机器学习现状、基本术语、发展历程及应用现状等。例如算法的种类,监督学习和无监督学习的区别,集成学习和强化学习的定义、分类和聚类的典型算法、特征提取和处理方式、模型评估与选择机制、模型训练及优化等。

  机器学习算法讲解:决策树、支持向量机、随机森林、kmeans、Arima算法及示例分析。

2、深度学习算法

  什么是深度学习、深度学习的背景、人脑视觉机理与特征、深度学习的基本思想及深度学习的实际应用类型及应用场景、浅层学习和深度学习的区别等。

  深度学习与神经网络的关系,深度学习的训练过程,其中包含传统神经网络的训练过程和Deep Learning的训练过程。

  Deep Learning常用模型和算法讲解:主要包括AutoEncoder自动编码器、稀疏编码(Sparse Coding)、transformer、DNN、RNN及LSTM等算法讲解和示例分析。

实战案例:分别用随机森林、支持向量机、CNN完成案例分析,具体数据场景待定

第三天:特征工程与模型选型

1、特征工程与数据处理

 数据预处理。包括缺失值、异常值及重复值处理方式,数据格式转换及数据采样。

 特征转换。包括连续型特征处理如函数转换、特征缩放、无量纲化等。离散型特征处理如数值化处理、哑编码、时间序列处理等。

 特征选择。包括特征检验(正态性检验、显著性分析)、特征选择的方法(过滤式、封装式及嵌入式)等。

 特征构造及提取。包括特征构造的定义及方法,特征提取的方法(PCA,LDA)等。

2、模型评估与模型选型

 回归问题评估指标(均方误差MSE、平均绝对误差MAE、决定系数R-squared)。

 分类问题评估指标(准确率、精确率、召回率、F1值)。

 交叉验证(k折交叉验证、留一交叉验证)

 模型选型(欠拟合与过拟合)

实战案例:基于不同模型分别对同一数据集进行模型训练,模拟欠拟合及过拟合发生过程,并根据评估指标分析模型选型的关键点。

第四天:基于机器学习的时序预测技术研究

1、时序预测的基本定义

  了解时间序列预测,主要包括时间序列相关术语、简介、时间序列预测概述、时间序列预测与其他回归任务的差异,并完成一个简单的对未来的预测。

2、白噪声及随机游走

  时序预测中的白噪声和随机游走,主要包括平稳性、平稳性检验、自相关函数的定义及如何融合的讲解,以及如何完成一次长期预测及预测下一个时间步长,以股票收盘价为例进行实战分析。

3、自回归滑动平均模型(ARMA)

  移动平均过程建模及自回归过程建模,主要包括移动平均过程的定义、预测,模拟MA(2)及MA(q)过程并做预测,定义自回归过程,如何计算平稳自回归过程的阶数,模拟AR(2)及AR(p)过程并做预测。

4、差分自回归滑动平均模型(ARIMA)

  ARIMA模型的基本定义、数据拟合的过程,例如数据预处理,检测和处理缺失值、检测和处理异常值、数据平稳性检测、差分处理、确定ACF及PACF参数,模型诊断,模型预测分析。

5、ARIMA模型延伸研究

  考虑季节性的ARIMA研究,主要包括SARIMA模型的讲解,如何识别时间序列的季节性,分别对同一案例采用ARIMA及SARIMA模型进行预测分析,对比两种方法的性能。

  讲解如何向模型中添加外生变量,及外生变量的使用和注意事项,讲解多变量时间序列的预测,讲解VAR模型及其建模过程,使用VARMA模型及VARMAX模型分别预测同一案例,对比两种方法的模型性能。

实战案例:采用ARIMA模型进行时序预测分析

第五天:基于深度学习的时序预测技术研究

1、深度学习与时序预测结合

  讲解如何使用深度学习进行时间序列预测,探索并研究不同类型的深度学习模型及框架,如何进行基于深度学习模型的数据处理,如何进行特征工程及数据拆分。讲解数据窗口的定义,如何创建数据窗口,什么是基线模型及如何应用,如何训练深度学习模型用于时序预测,不同的基线模型有什么区别,如何实现等。

2、LSTM模型讲解

  讲解LSTM模型的基本原理,包括递归神经网络的定义、研究LSTM模型的架构,分析遗忘门、输入门及输出门的原理,实现单步、多步、多输出LSTM模型。

3、RNN模型讲解

  讲解RNN的基本概念,RNN模型的作用,RNN模型的应用场景,训练及改进方式(GRU)等。

4、CNN模型讲解

  讲解卷积神经网络的基本结构,主要包括激活函数的种类及如何选择合适的激活函数,数据输入层的基本操作流程(去均值、归一化、PCA/白化等),中间层的架构组成及计算方式,主要包括卷积层、激励层和池化层,以及全连接层的运行逻辑。

实战案例:从头到尾完整进行一个项目,包括数据预处理,特征工程,初始化深度学习参数配置,定义DataWindow类,分别对基线模型、线性模型、网络模型、LSTMCNN等模型进行训练与效果评估,指导如何选用最佳模型。


培训时间

机器学习(深度学习)时序预测

2024.11.23-----2024.11.24全天授课(上午9:00-11:30下午13:30-17:00)

2024.11.25-----2024.11.26晚上授课(晚上19:00-22:00)

2024.11.30-----2024.12.01全天授课(上午9:00-11:30下午13:30-17:00)

腾讯会议线上授课(共五天授课时间提供全程回放视频)


培训费用


报名费用:

机器学习(深度学习)时序预测

费用:每人每班¥4980元 (含报名费、培训费、资料费)

优惠政策:

提前报名缴费学员+转发到朋友圈或者到学术交流群可享受每人300元优惠(仅限15名)

报名费用可开具正规报销发票及提供相关缴费证明、邀请函,可提前开具报销发票、文件用于报销。


培训福利


课后学习完毕提供全程录像视频回放,针对与培训课程内容 进行长期答疑,微信解疑群永不解散,参加本次课程的学员可免费再参加一次本单位后期组织的相同的 专题培训班(任意一期都可以)。


培训答疑与互动


  • 在培训中进行答疑和问题互动,以帮助学员深入理解课程内容和解决实际问题。

  • 学员可以提出疑问,讲师将提供详细解答,特别是针对技术难点和复杂算法。

  • 通过小组讨论和案例分享,学员将有机会交流经验,获得实时反馈,并进行实践操作演示。

  • 展示学员的学习成果,并提供进一步的提升建议和资源支持,为学员在未来的学习和工作中提供帮助和指导。


培训授课方式


通过腾讯会议线上直播,从零基础开始讲解,电子PPT和教程+预习视频提前发送给学员,所有培训使用软件都会发送给学员,附赠安装教程和指导安装,培训所有事宜请自行联系刘老师确认(见以下二维码)。培训采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师针对与培训内容长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高。


培训咨询


联系人|刘老师

咨询电话:13937166645(微信同号


kaggle竞赛宝典
数据竞赛Top方案,竞赛黑科技,竞赛到入职的一些感想。
 最新文章