在近期举行的2021年国际计算机视觉与模式识别会议(全球计算机视觉三大顶级会议之一,CVPR 2021: Conference on Computer Vision and Pattern Recognition 2021)上,北京邮电大学人工智能学院宋晴教授负责的BUPT-PRIV 团队(模式识别与智能视觉)在多个重要赛道中再创佳绩,斩获2项冠军、2项亚军。
BUPT-PRIV团队继2018、2019连续两年获得COCO-Densepose冠军,2020年获得CVPR LIP多人体解析竞赛两项冠军以来,基于实验室自主研发的Pet深度学习平台,继续深耕人体视觉理解和语义分割问题。
在本届CVPR国际竞赛中,BUPT-PRIV与苏黎世联邦理工学院(ETH Zurich)、北京理工大学(BIT)、中国科学院自动化所(CASIA-IVA)及百度等高校和企业合作,获得了2项冠军和2项亚军:L2ID高分辨率人体解析赛道的冠军、AutoNUE语义分割赛道的冠军、PIC短视频人脸解析赛道的亚军(腾讯冠军)、Woodscape鱼眼语义分割挑战赛的亚军(美团冠军)。
在L2ID高分辨率人体解析赛道和PIC 短视频人脸解析赛道两个赛道中,PRIV团队延续了在CVPR 2020 LIP挑战赛的竞赛方案:质量感知网络QANet (https://arxiv.org/abs/2103.05997)。质量感知网络主要分析了当前实例评分机制存在的问题,提出了基于综合检测框得分、交并比得分和像素得分的实例级质量评价方法。在此次的两个竞赛中,PRIV团队验证了QANet在人体视觉理解不同任务方向上的适用性,并针对任务的特点调整了训练和推理策略,最终获得了优异的成绩。
质量感知网络结构
AutoNUE 语义分割赛道和Woodscape鱼眼语义分割挑战赛都是针对自动驾驶场景中的语义分割问题。PRIV团队将transformer架构与苏黎世联邦理工学院(ETH Zurich)提出的对比分割ContrastiveSeg (https://arxiv.org/abs/2101.11939)方法结合,挖掘训练集中所有图像的全局上下文信息提升语义分割效果,在众多的参赛队伍中脱颖而出。
对比分割方法结构
向获奖师生团队表示热烈祝贺!