2024年9月30日,欧洲计算机视觉会议ECCV 2024在意大利米兰隆重举行。作为全球计算机视觉领域的顶级会议之一,大会期间备受关注的“FishNet Classification Challenge(水下目标识别挑战赛)”结果正式揭晓,来自VLRLab团队的人工智能与自动化学院2022级本科生戚正浩及博士生徐威、梁定康等人,在白翔教授的指导下,凭借出色的表现,荣获全球冠军。
ECCV(European Conference on Computer Vision,欧洲计算机视觉会议)与CVPR和ICCV齐名,是国际计算机视觉领域最具影响力的三大顶级会议之一。ECCV 2024水下目标识别竞赛作为其中的代表性赛事,极具前沿性与挑战性。该竞赛于2024年7月10日8:00至9月1日24:00举行,参赛选手需处理一个包含5673个种、2048个属、446个科作为类别的数据集,进行科、属、种三个粒度的分类。训练标签提供了这三个粒度的类别信息,而比赛的最终评价指标是三个粒度的分类准确率平均值,以此决定优胜者。
鱼类的生物学分类一直是该领域中的难题,以往方法在面对种类繁多且表征差异微小的物种时,常常出现识别错误。解决这一挑战不仅能帮助生物学家更高效、精准地进行鱼类分类,也将推动水下场景的理解和应用,对于海洋生态研究、环保监测等领域具有重大意义。
本次竞赛挑战巨大,参赛团队不仅要面对类别严重不平衡、细粒度表征差异不明显等技术难点,还需要克服数据集呈现长尾分布及水下环境与陆地环境的域差异。戚正浩所在团队通过精妙的策略应对这些挑战:他们使用类别平衡策略采样来减少长尾效应,借助权重标准化技术对表现相近的权重文件进行均值处理,提升模型的泛化能力,并采用了三种不同结构的EVA-02模型(linear head、MLP head和large scale EVA-02),最终通过投票机制对各模型的输出进行整合,获得最佳结果。
在团队老师的指导下,戚正浩始终秉持刻苦钻研、专注创新的科研态度。正是这种不懈努力,为他在此次ECCV 2024水下目标识别竞赛中的出色表现打下了坚实的基础,最终荣获全球冠军。
编辑|戚正浩
审核|罗琪頔