科研进展 | 人工智能学院博士研究生黄思理的论文被CCF-A类会议NeurIPS'2024接收

文摘 2024-09-29 18:01 吉林

人工智能学院博士研究生黄思理的论文《Decision Mamba: Reinforcement Learning via Hybrid Selective Sequence Modeling》被CCF-A类会议NeurIPS 2024接收。

NeurIPS，全称为神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems)，该会议固定在每年的12月举行，由NeurIPS基金会主办。NeurIPS是机器学习与泛人工智能领域的顶级国际会议。

黄思理同学是强化学习项目组成员，一直从事深度强化学习、迁移学习相关的研究工作，本篇工作由杨博、陈贺昌老师共同指导，同时与美国里海大学（Lehigh University）的Lichao Sun老师合作完成。

论文详情

题目：Decision Mamba: Reinforcement Learning via Hybrid Selective Sequence Modeling

第一作者：黄思理

会议名称：Thirty-eighth Conference on Neural Information Processing Systems (NeurIPS 2024)

会议类别：CCF-A类会议

论文概述：

最近的研究表明，Transformer模型将强化学习(RL)任务建模顺序任务表展现出了很大的潜力。其中，基于Transformer的智能体可以通过提供任务上下文(例如称为上下文强化学习的多条轨迹)，于在线环境中实现自我完善。然而，由于Transformer中注意力的二次计算复杂度，当前的上下文强化学习方法随着任务视界的增加而产生了巨大的计算成本。相比之下，Mamba模型以其处理长期依赖关系的高效性而闻名，这为上下文强化学习解决需要长期记忆的任务提供了机会。为此，我们首先通过替换Decision Transformer (DT)的主干部分实现了Decision Mamba (DM)。然后，我们提出了Decision Mamba-Hybrid（DM-H)，它同时继承了Transformer和Mamba在高质量预测和长期记忆两方面的优点。具体而言，DM-H首先通过Mamba模型从长期记忆中产生高价值子目标。然后，我们使用子目标来提示Transformer，建立高质量的预测。实验结果表明，DM-H在长期和短期任务中都达到了最先进的水平。在效率方面，长期任务中DM-H的在线测试比基于Transformer的基线快28倍。

吉林大学｜人工智能学院

吉林省长春市｜吉林大学中心校区

正新楼｜7F

http://mp.weixin.qq.com/s?__biz=Mzg4NzEzMTgxNg==&mid=2247500583&idx=3&sn=d70ea258af6c3189de83512693fd4308

吉林大学人工智能学院

介绍吉林大学人工智能学院建设情况

最新文章

青春向北，吉人天下|人工智能学院2024级本科生主题班会活动

追寻楷模之光，砥砺前行之路|黄大年纪念馆、地质博物馆研学活动总结

笃行致远惟实励新|人工智能学院本科教育教学评估系列活动之本科生学习生涯及职业规划座谈会

经验共分享交流促成长|人工智能学院保研经验分享会活动总结

人工智能学院本科教育教学评估系列活动之优秀学生事迹

“2024级研究生新生适应期心理健康教育”系列活动之——人工智能学院研究生新生团体心理辅导

筑梦AI，智启未来 | 人工智能学院2024级新生入学教育系列报道（九）—— 新生第一堂党课

蓄力生长，向光而行|“2024级本科生新生适应期心理健康教育”系列活动之——人工智能学院本科生新生团体心理辅导

人工智能学院本科教育教学评估系列活动之学科竞赛典型成果

人工智能学院本科教育教学评估系列活动之高质量发展研讨会（第二期）

强学风树榜样重引领｜人工智能学院学风建设及习惯养成分享会

学生活动｜“我与吉大的100天”原创作品征集活动

人工智能学院本科教育教学评估系列活动之优秀毕业生事迹（二）

人工智能学院本科教育教学评估系列活动之优秀毕业生事迹（一）

国庆节｜AI献礼祖国，共绘盛世篇章

人工智能学院本科教育教学评估系列活动之审核评估专题报告会

筑梦AI，智启未来|人工智能学院2024级新生入学教育系列报道（八）——日常事务管理

筑梦AI，智启未来|人工智能学院2024级新生入学教育系列报道（七）——爱校荣校教育之参观校史馆

人工智能学院本科教育教学评估系列活动之学习手册（学生版）

科研进展｜人工智能学院郭亚明同学以第一作者身份撰写的科研论文被CCF-A类会议NeurIPS'2024会议接收

科研进展 | 人工智能学院博士研究生黄思理的论文被CCF-A类会议NeurIPS'2024接收

科研进展 | 人工智能学院2023级博士研究生徐明伟的论文被CCF-A类会议NeurIPS'2024接收

科研进展 | 人工智能学院2022级硕士研究生孙亚东的论文被CCF-A类会议NeurIPS'2024接收

科研进展｜人工智能学院6篇论文被NeurIPS’2024接收

人工智能学院本科教育教学评估系列活动之学习手册（教职员工版）

人工智能学院本科教育教学评估系列活动之2024年秋季学期试卷复查工作

科研进展｜人工智能学院戴奕维、顾恒瑞同学的论文被 EMNLP 会议接收

筑梦AI，智启未来|人工智能学院2024级新生入学教育系列报道（六）——新生年级大会

人工智能学院本科教育教学评估系列活动之迎评工作部署会暨主题研讨会

喜报｜人工智能学院四位教授入选斯坦福与爱思唯尔联袂发布的“2024全球前2%顶尖科学家榜单”

筑梦AI，智启未来|人工智能学院2024级新生入学教育系列报道（五）——新生班主任见面会

活动总结|师恩如山重，学海共扬帆——教师节活动回顾

人工智能学院关于2025年接收推免生复试录取工作办法的通知

人工智能学院“知心智言”系列活动（第9期）——2024级本科生教育教学午餐会

筑梦AI，智启未来|人工智能学院2024级新生入学教育系列报道（四）——图书馆教育

校园安全｜筑牢安全防线，共建平安校园——交通安全倡议书

科研进展｜人工智能学院屈渤浩同学的论文被期刊 IEEE TPAMI 接收

活动总结|“智语世界”“智读未来”暑期英语打卡活动圆满结束

人工智能学院研究生会&团委招新啦！

筑梦AI，智启未来 | 人工智能学院2024级新生入学教育系列报道（三）——人工智能学院领导班子走访慰问2024级新生

报名通知｜人工智能微专业，开始报名啦！

筑梦AI，智启未来 | 人工智能学院2024级新生入学教育系列报道（二）—— 爱校荣校教育

筑梦AI，智启未来 | 欢迎新同学！人工智能学院2024年迎新工作纪实

筑梦AI，智启未来 | 人工智能学院2024级新生入学教育系列报道（一）—— 2024级新生及家长见面会顺利召开

学院新闻 | 人工智能学院4位教师获国家自然科学基金面上项目资助（申报成功率66.7%）

筑梦AI，智启未来｜下一站，吉林大学人工智能学院！

筑梦AI，智启未来｜AI礼遇，“新”火相传——致未来的你

筑梦AI，智启未来 | 这有一份新生报到攻略，请注意查收！

智联未来，数绘葫芦岛丨人工智能学院振兴之路专项实践团赴葫芦岛市进行实践（二）

筑梦AI，智启未来|走进吉大人工智能学院

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉