“青椒”上新｜人工智能实训之强化学习

科技 2024-11-20 17:30 北京

人工智能

强化学习

强化学习是现代科技领域中备受瞩目的前沿学科之一，旨在通过代理程序与环境的交互学习最优决策策略，以最大化累积奖励。本课程主要介绍强化学习所涉及的一些常见算法并进行代码实践，讲述强化学习前沿领域，形成循序递进的过程，让学员逐渐熟悉强化学习相关算法。

课程网址（点击文末“阅读原文”可跳转）

https://www.qingjiaoclass.com/market/detail/65940

课程目标

本课程采用“原理讲解+编程实战”的学习模式，通过对原理的学习，完成相应实战训练，实现对核心技术与算法的熟悉和掌握。

课程内容

初识强化学习

马尔可夫决策过程

动态规划算法

时序差分算法

Dyna-Q算法

DQN算法

策略梯度算法

强化学习前沿领域

算法实践

项目一

马尔可夫决策过程

本项目旨在通过构建基马尔可夫决策过程算法，进行代码实现，加深大家对于强化学习经典算法的理解，考核重点复现经典的马尔可夫决策过程算法、马尔可夫奖励过程，训练模型并测试模型效果。

项目二

动态规划算法

动态规划算法作为强化学习中经典算法之一，用空间换时间，高效地解决了一些经典问题。在讲解动态规划算法的同时，我们也会为大家介绍悬崖漫步环境与冰湖环境，实习策略迭代算法。

悬崖漫步环境

冰湖环境

项目三

时序差分算法

主要讲解了基础原理、Sarsa、多步Sarsa算法原理及复现。在悬崖漫步环境下，训练Sarsa等算法，将训练的结果输出，改变参数，熟悉参数意义。

项目四

Dyna-Q算法

此算法通过联合使用真实经验数据和模拟经验数据，能够在学习的过程中同时规划价值函数和策略函数，使得智能体在实际任务中获得更优的策略。算法的流程如下：

项目五

DQN及其衍生算法

使用神经网络来近似值函、车杆环境、损失函数的设定、经验回放、Double DQN算法和Dueling DQN。本小节将会带领大家学习并掌握上述内容。

项目六

策略梯度算法

本小节探讨了如何直接从状态输出策略，以及如何通过目标函数和梯度优化寻找最优策略。着重讲解了平均状态价值和平均奖励作为目标函数，以及REINFORCE和actor-critic方法的应用。

项目七

策略梯度算法优化算法

在本章节中，我们将学习策略梯度的改进算法，包括通过限制策略更新TRPO算法、通过比较新旧策略进行优化的PPO算法、通过使用特殊的网络机构和训练方式改进效果的DDPG算法和通过引入值函学习的SAC算法等。

项目八

强化学习前沿领域

在本章节中我们将简单探讨关于强化学习比较热门的两个研究方向，包括通过使用收集到专家的示范数据训练的模仿学习和基于模型的策略优化（MBPO）等算法。

关注“新道工科”公众号，“青椒课堂”平台内容全知道！

新道工科聚焦新IT与工业互联网，涵盖信息安全、工业互联网、大数据、人工智能、区块链、智能网联汽车、智能制造、工业智能等多个专业领域，基于用友集团和新道科技子公司红亚科技的产业与技术优势，不断深化和拓展数智化教学产品和内容，形成覆盖范围更广的课程体系及综合解决方案，为本科、高职、中职院校提供优质教学服务。

扫码关注

新道工科

微信号｜hongyaa-2012

新道工科

北京红亚华宇科技有限公司（新道工科）隶属用友集团，是新道科技股份有限公司全资子公司。红亚科技肩负科技使能教育、服务中国教育事业的使命，致力于打造新时代的新工科人才培养新体系，为国内本科、高职、中职院校提供优质的教学服务。

最新文章

课程实践｜南通理工学院用友数智学院《大数据课程设计》教学工作圆满完成

走进“青椒课堂”｜综合实训之医疗类项目案例（4）中医证型关联规则挖掘

回顾2024｜新道科技新工科“数”联校企，“智”启新程

多元赛道，闪耀征程｜新道科技新工科第四季度赛事精彩回顾

走进“青椒课堂”｜综合实训之医疗类项目案例（3）中风患者识别预测

走进“青椒课堂”｜综合实训之医疗类项目案例（2）睡眠健康分析预测

走进“青椒课堂”｜综合实训之医疗类项目案例（1）肺癌风险预测

荣耀揭晓｜第五届全国电信和互联网行业计算机程序设计员S职业技能竞赛暨“用友杯”第七届全国大学生大数据技能竞赛全国总决赛获奖名单

赛事速递｜2024年“金锤杯”滨海计算机程序设计员（大数据分析方向）职业技能大赛圆满结束

走进“青椒课堂”｜综合实训之金融类项目案例（2）交易欺诈风险识别

走进“青椒课堂”｜综合实训之金融类项目案例（1）财经舆情文本分析

“青椒”上新｜“AI大模型”教学科研训推一体化平台

走进“青椒课堂”｜综合实训之农业类项目案例

走进“青椒课堂”｜物联网实训之边缘计算-规则引擎与组态（软件版）

《生成式人工智能应用职业技能等级标准》正式发布，推动行业人才高质量发展

原国家人社部党组副书记、副部长杨志明：数智赋能技能人才高质量发展

第五届全国电信和互联网行业计算机程序设计员S 职业技能竞赛暨“用友杯”第七届全国大学生大数据技能竞赛总决赛圆满落幕

第五届全国电信和互联网行业计算机程序设计员S职业技能竞赛暨“用友杯”第七届全国大学生大数据技能竞赛总决赛正式开幕

“青椒”上新｜人工智能实训之强化学习

融产入教，领先实践！新道科技“废钢判级”教学产品赋能人工智能人才培养

重要通知｜第五届全国电信和互联网行业计算机程序设计员S职业技能竞赛暨"用友杯"第七届全国大学生大数据技能竞赛总决赛晋级名单

赛事速递｜第五届全国电信和互联网行业计算机程序设计员S职业技能竞赛暨"用友杯"第七届全国大学生大数据技能竞赛总决赛练习资源一览

赛事速递｜理论题库上线！点击查看练习方式

走进“青椒课堂”｜物联网实训之边缘计算数据采集（软件版）

第五届全国电信和互联网行业计算机程序设计员S（大数据分析方向）职业技能竞赛暨“用友杯”第七届全国大学生大数据技能竞赛总决赛通知

赛事速递｜组委会选拔赛复盘解读直播预告

“青椒”上新｜人工智能实训之知识图谱

智驭未来·界启新章｜人工智能驱动大数据专业创新发展研讨会暨“生成式人工智能应用工程师”专题培训成功举办

赛事速递｜山东省“技能兴鲁”职业技能大赛——第六届山东省移动互联网及5G应用创新职业技能竞赛计算机程序设计员工种赛项决赛圆满结束

用友连续六年入选国家级“双跨”工业互联网平台，强大产业优势助力新道科技新工科培育数智人才

赛事速递｜第五届全国电信和互联网行业计算机程序设计员（大数据分析方向）职业技能竞赛（职工组、学生组）组委会选拔赛顺利举办！

赛事速递｜“江苏工匠”岗位练兵职业技能竞赛——2024年计算机程序设计员职业技能竞赛决赛圆满落幕

第六届“智警杯”大数据技能竞赛总决赛暨“智慧警务数创未来”警务数据发展与应用研讨会圆满落幕！

赛事速递｜第七届“用友杯”全国大学生大数据技能竞赛——组委会选拔赛赛前说明会助力备赛！

赛事速递｜第二届山东省数字赋能高质量发展职工创新大赛——大数据与人工智能分析技能竞赛决赛成功举办

新道科技与广西警察学院共建“数智警务人才培养基地” 揭牌仪式顺利举行

赛事速递｜2024年“海河工匠杯”技能大赛——第五届全国电信和互联网行业职业技能竞赛天津选拔赛圆满落幕

赛事速递｜关于举办第五届全国电信和互联网行业计算机程序设计员(大数据分析方向)职业技能竞赛组委会选拔赛的通知

工业和信息化部教育考试中心与新道科技签署战略合作协议构建数智人才培养新生态

“青椒”上新｜工业互联网实训之工业互联网标识解析

关于举办人工智能驱动大数据专业创新发展研讨会暨“生成式人工智能应用工程师”专题培训的通知

赛事速递｜"用友杯"第七届全国大学生大数据技能竞赛选拔赛——理论题库更新发布！

以赛促学｜“用友杯”选拔赛实训练习之Hadoop批处理调度器：Azkaban（二）

13省、26市、38场！第三季度新道科技新工科赛事精彩回顾

用友闪耀2024东京国际废钢会议，助力全球废钢产业高质量发展

赛事速递｜安徽省职业技能竞赛——2024年全省数字金融行业职业技能竞赛计算机程序设计员赛项成功举办

赛事速递｜2024年第五届全国电信和互联网行业计算机程序设计员(大数据分析方向)职业技能竞赛——广东省选拔赛圆满结束

赛事速递｜2024年第五届全国电信和互联网行业计算机程序设计员(大数据分析方向)职业技能竞赛——中国移动集团选拔赛成功举办

走进“青椒课堂”｜综合实训之电力类项目案例

赛事速递｜2024年黑龙江省电信和互联网行业职业技能竞赛计算机程序设计员(大数据分析方向)赛项圆满落幕

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉