﹀
﹀
﹀
跨模态生成:图像生成和视频生成的经典论文回顾
跨模态理解:多模态大模型经典综述论文回顾,以及多模态幻觉(Multimodal Hallucination)、片段定位(Grounding)、具身智能(Embodied Intelligence)、视频理解中高效帧采样的单帧偏置(single frame bias)等重要学术问题讨论
3D 生成:单场景 3D 重建、多模态 3D 重建论文回顾及讨论
跨模态生成:盘点图像生成/视频生成/ 3D 生成模型和工具
跨模态理解:盘点闭源以及开源模型和工具(包括图片理解模型、视频理解模型、训练和部署工具、评测benchmark等)
创源引擎、极佳科技、万物灵犀三家奇绩校友企业的实践案例
技术发展趋势的观察和思考
商业化机会与挑战的探讨