AI Talk直播预告③ | 详解InternVideo2:最新多模态视频基础模型

文摘   2024-06-18 14:21   上海  

(点击查看浦数AI Talk直播活动介绍)

第3期分享主题

01

第3期精彩预告

在人工智能的多模态时代,大模型对视频数据集的需求日益增长。视频-文本数据集作为理解复杂场景和生成内容的关键,已成为推动视频理解和生成能力提升的重要资源。然而,研究者们面临着数据规模、多样性和标注质量的挑战

上海人工智能实验室(上海AI实验室)联合南京大学、中国科学院等机构联合发布高质量大规模视频-文本数据集InternVid正是为了应对这些挑战而生。作为目前全球最大的视频-文本公开数据集之一,InternVideo不仅拥有超700万条视频和76万小时的总时长,更以其高质量和大规模的特点,为多模态研究提供了丰富的素材。


6月19日19:00,上海人工智能实验室青年研究员 香港中文大学博士 王毅将带来《详解InternVideo2:最新多模态视频基础模型》的主题分享,介绍大规模视频-文本数据集InternVid构造策略,以及在此基础上训练出最新多模态视频基础模型——InternVideo2。欢迎扫海报中二维码或点击下方按钮预约观看~


02

亮点预览

● 大模型视频理解和生成发展综述

● 当前全球最大的视频-文本公开数据集之一InternVid介绍

● 最新多模态视频基础模型InternVideo2详解

InternVid数据集介绍

InternVid:用于多模态视频理解与生成的大规模视频-文本数据集 | ICLR Spotlight

(点击查看)


InternVideo2模型介绍:

https://arxiv.org/pdf/2403.15377


扫描上方二维码,添加小助手
加入交流群,获取完整直播链接
也可在下方点击或扫码预约

视频号预约:

直播活动支持:

OpenGVLab、bilibili、示说网



更多精彩内容等你定制
投票选出你最感兴趣的话题,下季内容由你决定!



欢迎扫码进AI Talk 多模态交流群,一起探讨最前沿的内容
更多精彩数据内容,尽在OpenDataLab:
https://opendatalab.org.cn/


赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源

2024-06-06

浦数 AI Talk 第五季 | 直击前沿:探索多模态AI的无限可能①——详解InternVL,开源多模态大模型“黑马”

2024-06-04

上海AI Lab开源首个可替代GPT-4V的多模态大模型

2024-06-04

浦源大模型挑战赛(夏季赛)·安全可信赛道正式启动!

2024-06-03

OpenDataLab
上海人工智能实验室是我国人工智能领域新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。
 最新文章