华东师范大学“大模型俱乐部”第四次研讨会成功举办

教育 2024-08-08 11:44 上海

8月6日下午，华东师范大学大模型俱乐部第四次线下研讨会在理科大楼B112成功举办，本次活动吸引了众多对多模态大模型感兴趣的师生参与。

此次研讨会有幸邀请了复旦大学大数据学院副教授、智能复杂体系实验室双聘研究员、博士生导师、数据智能与社会计算实验室（Fudan DISC）负责人魏忠钰老师，他是香港中文大学博士，美国德州大学达拉斯分校博士后，担任CIPS情感计算专委会副秘书长，CCF自然语言处理专委会副秘书长，曾任CIPS青工委执委会副主任。主要研究领域包括多模态大模型和社会计算，发表论文100余篇，担任ACL 2023多模态高级领域主席（SAC），EMNLP 2024论辩挖掘高级领域主席。代表成果包括多模态多步推理大模型Volcano和 DISC-X系列垂域大模型（覆盖医疗、司法、金融、网络治理四个领域）。曾获得2019年度CIPS社会媒体处理专委会新锐奖，2021年上海市启明星计划，2022年CCF自然语言处理专委会新锐学者奖。

本次报告，魏忠钰老师以“多模态大模型的前沿趋势”为主题，综述当前多模态大模型的架构发展和未来趋势，并介绍Fudan DISC推出的多模态大模型评测基准Reform-Eval以及多步推理多模态大模型Volcano。

首先，本报告介绍了多模态大模型研究的发展阶段，从任务导向阶段到多模态预训练阶段，再到现在的多模态大语言模型研究阶段，模型规模不断扩大，训练范式也发生了转变。在多模态大语言模型的设计思路方面，魏老师从输入和输出的语义空间设计以及中间的对齐方法角度进行了阐述。输入模态的语义设计分为连续特征空间和离散特征空间，目前的研究重点是如何做好视觉的离散表征，以实现视觉信息与文本信息更好的关联。输出端则需要考虑离散空间或连续空间的语义建立。

接着，魏老师从视觉输入空间设计、增强视觉表征、输出空间设计、语义对齐方案等方面详细介绍了多模态大模型的前沿研究工作。包括视觉编码器的训练、高分辨率图片处理、输出空间的改造、离散编码器的设计等内容。此外，魏老师还介绍了团队在多模态大模型评测方面的工作，包括构建全面可靠的评价基准，以及对大视觉语言模型输出稳定性的评价等。最后，魏老师分享了关于多模态多步推理大模型的工作，提出了以物体作为锚点的多模态思维链，通过图文混合的推理过程，模型在各项任务上取得了较好的性能提升。

互动环节由周杰老师主持，现场气氛热烈，参会者积极提问。有参会者问到关于GPT-4o实现良好语音、图像及视频理解效果的背后技术，以及与研讨会中所提及技术的相关性。魏老师表示，多模态大模型的基础处理框架在一定程度上是相似的，性能的好坏可能取决于训练数据的质量、数量以及工程化处理的差异。同时，魏老师还提到GPT-4o在流畅性方面的表现令人惊艳，但其具体实现方式可能涉及工程上的输入输出分离等操作，不在其研究范围内。

此外，还有参会者就多模态大模型在数数问题上的表现进行了讨论，魏老师指出数数对于模型来说是一件极难的事，因为模型的训练与人类的训练方式不同。同时，关于多轮对话和多步优化的问题也引发了大家的关注，魏老师认为多步优化是一个很值得研究的方向，虽然多步训练和操作难度更大，但在合理的条件下，多步可能会比单步取得更好的效果，并且这个方向有很多问题值得探索，如样本构造、监督设置、训练过程等。

此次研讨会为多模态大模型的研究提供了一个极为有益的交流平台，参会者们在研讨会上分享了各自的研究成果和经验，深入探讨了多模态大模型领域的关键问题和挑战。这种思想的碰撞和交流，不仅促进了相关领域的学术发展，也为未来的研究工作提供了新的思路和方向。相信通过这样的研讨会，能够推动多模态大模型的研究不断向前发展，为人工智能领域的进步做出更大的贡献。

华东师范大学计算机学院

华东师范大学计算机科学与技术学院官微

最新文章

计算机科学与技术学院2025年博士研究生招生申请考核工作办法

计算机学院副院长任免宣布会举行

倒计时！华东师范大学第十届（2024年度）青年科学家（学者）国际论坛——计算机科学与技术学院分论坛即将开幕

计算机学院教工党支部与长风集团本部党支部开展主题党日活动

学科交叉融合论坛“AI赋能大装置科学计算”顺利举办

海南学子齐聚、共筑梦想篇章——2024级海南新生座谈会圆满举办

计算机科学与技术实践工作站（第3期）学习之旅圆满收官

计算机学院党委举办学生支部书记午餐会

计算机学院举办师生座谈会暨本科教学发展及双创指导创新交流会

计算机学院成功举办ECNU第二届研究生学术文化节系列活动

周爱民拜访杰出院友尼玛扎西院士

计算机学院与上海证券交易所、普陀区数据局开展党建联建活动

秋游乌镇，感受水乡风情

喜报 | 计算机工程实验教学示范中心入选2024年上海市级实验教学示范中心名单

喜报 | 计算机学院学生团队获得“挑战杯”全国金奖1项、铜奖1项

计算机学院教工党员赴杨浦滨江参观记

计算机学院团队在中国研究生操作系统开源创新大赛荣获佳绩

计算机学院教师积极参加2024年学校运动会

学生邀请函 | 2024年秋季华东师范大学软件&计算机&数据&设计四院联合招聘会预告

喜报 | 计算机学院在中国国际大学生创新大赛（2024）斩获全国银奖

开怀叙旧游园赏秋 | 计算机学院举行退休教师重阳节活动

计算机学院贺樑教授获得九三学社中央表彰

计算机学院张桂戌教授领衔项目荣获上海市自然科学一等奖

旧雨新知，共忆往昔 | 计算机学院2024年校友日活动隆重举行

计算机学院召开新学年首次教职工大会

计算机学院开展2024级新生党员教育活动

计算机学院荣获华东师范大学离退休先进集体

全国一等奖+2！计算机学院研究生团队创佳绩

计算机科学与技术学院李海晟副教授研发的FiberPath CAD亮相工博会

贺樑教授荣获华东师范大学第十四届师德标兵

喜报｜计算机学子获华为无限软件日第十六届软件精英杯编程大赛高校赛道冠军

丽江师范学院到访计算机科学与技术学院

华东师范大学计算机科学与技术学院研究生招生报考指南

“计”承初心、创智未来 | 计算机学院2024级新生开学典礼圆满举办

计算机学院举行座谈会庆祝第40个教师节

计算机学子在百度之星程序设计大事总决赛取得佳绩

计算机学院本科新生报到日，上演温馨故事

喜报 | 计算机学院获批8项国家自然科学基金立项资助

【校友报告】8月21日：3D+AI在元宇宙-数字人领域的前沿拓展

人工智能赋能非遗传承，华东师大这支学生社会实践团队用大模型承载少数民族文字

逝者 | 计算机学院退休教师周建中同志逝世

华东师范大学“大模型俱乐部”第四次研讨会成功举办

华东师范大学“大模型俱乐部”第三次研讨会成功举办

学习进行时 | 周爱民院长带队赴南京大学、东南大学相关学科学习调研

学习进行时｜计算机学院与教育学部一线管理服务团队联组学习“人工智能”

探索人工智能与数学深度交叉融合，落地云计算资源规划调度应用

计算机学院教工党员赴延安参加党史党纪专题培训

视觉与媒体智能团队连续两年获评中国人工智能学会-昇思MindSpore学术基金优秀项目

科技绘未来智造铸青春 | 计算机科学与技术实践工作站举行第3期开营仪式

重磅发布 | 《中小学教育数字化转型千校联盟华东师范大学宣言》

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉