近年来,三维点云的语义分割在虚拟/增强现实、机器人技术和自动驾驶等领域得到了广泛关注。传统的点云语义分割方法通常假设世界是一个封闭集,并且在训练和推理阶段中的对象类别保持一致。然而,这种假设在实际的动态场景中显然是不成立的,模型在遇到未见过的类别时容易做出错误决策。此外,传统方法还难以应对不断变化的环境,无法像人类一样持续扩展其知识库。
本工作主要贡献如下:
提出了一种新的概率驱动框架(PDF),用于开放世界的三维点云语义分割任务;
设计了一个轻量级的不确定性解码器,通过估计不确定性来识别未知类别;
提出了一种伪标签生成方案和增量知识蒸馏策略,有效地将新类别逐步融入现有知识库。
PDF方法由两大关键组件构成:不确定性解码器和增量知识蒸馏策略。第一部分的目标是在训练过程中识别未知类别并生成相应的伪标签,而第二部分则致力于在不忘记已知知识的情况下,逐步将新类别融入到模型的知识库中。
图2 边的权重分布图
如图3实验结果可视化展示,可以看出相比于现有其他方法,PDF在OSS任务上可以更好地识别出新类别同时未在旧类别上出现灾难性遗忘现象。
从表1可以看出,PDF方法在AUPR和AUROC指标下都有不错的表现,但在mIoU指标上却低于其他现有方法。
表2展示了在S3DIS数据集上进行增量学习的结果,重点评估了模型在已知类别和新类别上的表现,以及整体的mIoU。相比于其他增量学习方法,PDF方法在增量学习中很好保留了对已知类别的记忆,避免了灾难性遗忘现象。
-- End--
[1] Dan Hendrycks and Kevin Gimpel. A baseline for detecting misclassified and out-of-distribution examples in neural networks. International Conference on Learning Representations (ICLR), 2017.
[2] Hengshuang Zhao, Li Jiang, Jiaya Jia, Philip H.S. Torr, and Vladlen Koltun. Point transformer. International Conference on Computer Vision (ICCV). 16259-16268, 2021.
[3] Xin Lai, Jianhui Liu, Li Jiang, Liwei Wang, Hengshuang Zhao, Shu Liu, Xiaojuan Qi, and Jiaya Jia. Stratified transformer for 3D point cloud segmentation. Conference on Computer Vision and Pattern Recognition (CVPR). 8500-8509, 2022.
[4] Jun Cen, Peng Yun, Shiwei Zhang, Junhao Cai, Di Luan, Mingqian Tang, Ming Liu, and Michael Yu Wang. Openworld semantic segmentation for lidar point clouds. European Conference on Computer Vision (ECCV). 318-334, 2022.
[5] Jianan Li and Qiulei Dong. Open-set semantic segmentation for point clouds via adversarial prototype framework. Conference on Computer Vision and Pattern Recognition (CVPR). 9425-9434, 2023.
[6] Zhizhong Li and Derek Hoiem. Learning without forgetting. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI). 40(12), 2935-2947, 2017.