预测2025顶会多模态大模型热门research!

科技   2024-12-16 12:19   北京  

顶会ACL‘24录取的940篇论文中,LLM-Multi agent居于高频词榜单,热度不断攀升。LLM-Multi agent无疑是今年的热点词。北大、中科院、微软等多个国内外权威研究团队都瞄准了这个方向。此外,Multi agent无需针对特定任务或场景进行额外的微调,对算力的需求大大降低,为科研开辟了一条更高效的探索道路。

为了让大家更好的掌握LLM-Multi Agent发现创新点冲击2025顶会,研梦非凡于12月20日晚(周五),邀请了从事多模态大模型研究的王导师,为大家独家详解《LLM-Multi Agent赋能端到端网页操作》(AI前沿直播课NO.88),主要讲解ACL'24的前沿研究。LLMs的行业热点及顶会热门方向,到多智能体的创新点和相关工作详解重点讲解多智能体算法框架、实验要点,并具体演示代码一节课速通多智能体在网页导航中的应用,发现论文idea。

👇🏻扫描二维码找助教0元预约直播课!

凡预约即可免费领取300+篇相关论文(各大顶会最新多智能体+140篇多模态+120篇大模型

直播课课程大纲

《WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models》

一、多模态智能体核心根据

行业热点

  • 2025顶会热门方向
  • 大语言模型智能体的应用
  • 多模态大语言模型的迅速发展

二、找创新点

思考研究现状

  • Web操作自动化的研究意义
  • 目前智能体在Web操作上关注什么?
  • 目前Benchmark关注什么?

创新点

  • 提出了一个多模态的Web智能体WebVoyager
  • 提出了一个真实Web世界任务,并引入了一个自动评估协议

三、相关工作详解

  • 大模型智能体应用
  • 智能体在Web操作中的应用
  • 多模态大语言模型
👇🏻扫描二维码找助教0元预约直播课!

凡预约即可免费领取300+篇相关论文(各大顶会最新多智能体+140篇多模态+120篇大模型

四、算法框架

  • Browsing Environment
  • Observation Space
  • Action Space

五、实验要点

  • Benchmark for WebVoyager
  • Data Construction
  • Experimental Details
  • Results and Discussion

六、探索

  • WebVoyager Python代码实现

导师介绍

 王导师  
【学术背景】拥有丰富的深度学习研究、论文发表经验,多篇SCI论文、EI会议论文(一作)
【研究方向】大语言模型、视觉语言模型、多模态学习,以及自然语言处理、进化算法等
👇🏻扫描二维码找助教0元预约直播课!

凡预约即可免费领取300+篇相关论文(各大顶会最新多智能体+140篇多模态+120篇大模型

研梦非凡科研论文指导

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!
<<< 左右滑动见更多 >>>
👇🏻扫描二维码找助教0元预约直播课!

研梦非凡部分导师介绍

研梦非凡导师团队,来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后,以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~
<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

全新6人尖端科研课题组论文辅导

<<< 左右滑动见更多 >>>

我们不是小作坊哦~我们背靠研途考研(就是张雪峰老师和徐涛老师在的那个研途考研),做教育十余年,重交付,重口碑,是我们一贯的公司理念!

arXiv每日学术速递
工作日更新学术速递!官网www.arxivdaily.com。
 最新文章