2024年11月8日-9日,由中国科协立项支持,中国图象图形学学会承担的通用人工智能青年科学家沙龙活动在中国科技会堂举办,30余位来自高校、科研院所及企业的优秀青年科学家围绕相关议题开展交流研讨。本次沙龙活动由电子科技大学教授高联丽担任执行主席,南开大学副教授侯淇彬担任学术秘书。
图 1 会议现场
主旨报告环节,南开大学程明明以“高效能个性化图像生成”为题,介绍了如何通过引入结构信息建模能力和个性化信息编码能力,有效避免现有多模态生成技术在模型训练和个性化生成方面表现出较低效率的问题。与会青年科学家就视频生成模型未来发展方向与前景、图像个性化生成的新范式等提问交流。湖南大学方乐缘作“资源受限遥感影像处理”报告,针对遥感影像解译面临的数据受限、标注受限和算力受限三大挑战,提出高效高分辨率遥感影像编码技术、先验知识辅助的遥感特征增强技术,以及渐进式遗忘遥感模型剪枝技术。与会青年科学家就如何更高效地利用遥感数据、针对视觉Transformer模型的剪枝技术进展等提问交流。中国科学技术大学常晓军围绕“多模态大模型赋能具身智能”主题,探讨多模态大模型在具身智能中的核心作用与优势,分享了智能体中多模态信息融合和多种学习策略、环境理解与记忆管理技术和视觉语言导航推理与理解技术,展示了最新的研究进展和实际应用案例,为未来的智能系统发展提供了新思路。与会青年科学家就视觉语言导航的研究进展、不同环境之间的迁移导航技能等提问交流。
图 2 主旨报告环节
自由发言环节,青年科学家们围绕通用人工智能的发展、底层视觉大模型研究、蛋白受体与功能小分子交互的智能识别方法研究、人机交互与协作的未来、跨模态内容理解与生成、可控生成式模型的现状与展望、脑电波和文本的情感分析方法与应用、多模态大语言模型图像质量评价与重建等议题展开热烈讨论,结合研究专长发表各自见解。对话交流环节,中国科学院自动化研究所研究员王亮与青年科学家们进行探讨交流。
图 3 交流讨论
与会青年科学家一致认为,人工智能在特定领域如图像识别、自然语言处理、语音处理、图像视频生成等取得显著成就,但实现通用人工智能仍面临数据质量、算法复杂性和计算资源需求等挑战。建议研究高效且强大的基础模型,围绕有效将海量的不同模态数据映射到统一的特征空间、在当前大模型中借助知识图谱等先验知识、提升具有高效的学习和泛化能力且能够根据复杂动态环境自主产生并完成任务的智能体进行研究,并加强伦理治理和国际合作。
图 4 参观启元实验室
会前,青年科学家赴启元实验室进行实地考察,进一步加深对智能科技领域前沿技术的理解,感受到了“体现国家意志、服务国家战略、承担国家使命、代表国家水平”的使命和责任。