点击蓝字 关注我们
近日,由中国移动研究院中国移动技术能力评测中心(以下简称:评测中心)承办的第七届中国模式识别与计算机视觉大会(PRCV 2024)“科大讯飞杯”基于多模态大模型的智慧城市治理图像识别挑战赛圆满落幕。经过各参赛队伍的激烈比拼,来自电子科技大学、北京邮电大学等单位的5支团队获得优胜。
PRCV是计算机视觉领域国内顶级学术盛会,由中国人工智能学会(CAAI)、中国计算机学会(CCF)、中国自动化学会(CAA)和中国图像图形学学会(CSIG)联合主办,迄今为止已成功举办七届全国规模竞赛,历年来聚焦于视频图像分析识别等诸多领域,吸引了数千支队伍报名参加,有力推动了计算机视觉与模式识别领域的发展。
为推动多模态大模型评测技术应用创新,评测中心发布“基于多模态大模型的智慧城市治理图像识别”赛道。本次大赛聚焦智慧城市治理多类典型场景,要求各参赛队伍利用给定的图片和自定提示词,基于特定多模态大模型适配多任务,实现针对佩戴口罩、人类头部、电动车进电梯、佩戴厨师帽和物体搬运等目标的识别与检测能力,探索多模态大模型能力调优技术,为智慧城市治理提供一站式解决方案,更好地促进AI+产业发展。
智慧城市治理典型场景
作为本次大赛的组织者,评测中心负责了赛题准备、赛道上线、竞赛组织、性能评估等多方面工作,确保了赛事的顺利进行。历时四个月竞赛过程中,各支团队带来了一系列引人注目的创新成果,为我们展示了多模态大模型在多任务识别检测领域的发展前景。参赛队伍的解决方案不仅各具特色,而且具有很高的实用价值,对于提升多模态大模型的泛化能力、推动实际应用具有重要意义。
未来,评测中心将继续紧跟多模态大模型评测技术发展趋势,为赋能产业应用贡献评测力量。