Vision Group一篇论文被ECCV2022录用

       实验室陈鹏飞提交的论文Point-to-Box Network for Accurate Object Detection via Single Point Supervision被ECCV2022录用。祝贺陈鹏飞,余学辉及韩许盟同学!ECCV是人工智能领域内著名的会议,是计算机视觉三大顶会之一,每偶数年举行一次。ECCV2022有超过8170篇投稿,共有1629篇论文中选。
       使用单点监督的目标检测在最近几年得到了广泛的关注,但是点监督目标检测(PSOD)和用包围框监督的目标检测在性能上仍然有很大的差距。本文把如此大的性能差距归因于之前的方法没有产生高质量的提议包,这对多实例学习(multiple instance learning,MIL)的优化是至关重要的。为了解决这些问题,我们提出了一个轻量的,替换掉基于现成提议OTSP方法(类似于selective search)的网络: Point-to-Box Network(P2BNet)。P2BNet通过类似anchor的方式,构建出对于不同目标之间数量平衡的提议包。通过充分利用标注点的精准位置信息,P2BNet 构建了一个实例级别的提议包,避免了多个不同目标间的混淆。最后,一个由粗到精的级联策略被用于提高候选框和真实框(ground-truth)之间的交并比(IoU)。受益于这些策略,P2BNet能够在训练集上根据点标注产生高质量的伪标签框,以训练传统检测器。相对于先前最好的PSDO方法,P2BNet在MS COCO数据集上提升了超过50%的平均AP,它为拉近点监督目标检测和包围框监督目标检测之间的差距提供了可能。数据集和代码将公布在https://github.com/ucas-vg/P2BNet 上。

 

 

       Vision Group@UCAS成立于2019年,主要从事机器学习、图像和视频处理及计算机视觉等领域的研究。实验室承担了国家自然科学基金项目、航天科工及华为公司等单位课题。