实验室4篇论文被国际计算机视觉与模式识别会议CVPR 2019接收

 

IRIP实验室今年共有4篇论文被国际计算机视觉与模式识别会议CVPR 2019接收!CVPR是由IEEE主办的计算机视觉模式识别及人工智能等领域最具影响力和最重要的国际顶级会议CVPR官网显示,此次会议有超过5165篇的大会论文投稿,共录取1299篇论文。此次会议将于20196月在美国长滩召开。

 

    接收论文简要介绍如下:

 

1. Adaptive NMS: Refining Pedestrian Detection in a Crowd (Songtao Liu, Di Huang, Yunhong Wang)

 

   为了解决行人检测任务中目标过于密集的问题,本文提出了一种自适应的非极大值抑制(Adaptive NMS)的行人检测后处理方法,通过网络预测目标周边的密集和稀疏的程度,采用不同的去重策略。该方法对于双阶段和单阶段的检测器都有效果,在密集行人数据库CityPersonsCrowdHuman上都能提升现有的检测器的效果。本文已被CVPR2019接受为Oral

 

 

2. KE-GAN: Knowledge Embedded Generative Adversarial Networks for Semi-Supervised Scene Parsing (Mengshi Qi, Yunhong Wang, Jie Qin and Annan Li)

 

由于传统场景解析方法忽视了图像中丰富的语义知识信息,并且大部分需要海量像素级别训练数据。因此,我们提出了一个新的知识嵌入生成对抗网络模型,实现半监督场景解析。一方面,我们所提出的模型借助大型知识图谱来提取不同类别标签之间的语义一致性和相似度;另一方面,我们使用生成网络来合成大量场景结构图像来缓解训练数据不足的难题,并利用对抗训练学习提高网络对像素的分类性能。实验中,通过在多个国际通用数据库上的测试,实验结果验证了所提模型的有效性与优越性。 

 

3. Led3D: A Lightweight and Efficient Deep Approach to Recognizing Low-quality 3D Faces (Guodong Mu, Di Huang, Guosheng Hu, Jia Sun, and Yunhong Wang)

 

     该工作主要是针对由消费级深度摄像头所采集的低质量三维人脸数据进行身份识别的任务,提出来包含

 

1)低质量深度人脸数据的预处理方法;

 

2)针对数据特点的扩增方法;

 

3)针对边缘设备计算需要的轻量高效的CNN模型;

 

4)新的应用场景:跨质量的三维人脸身份识别

这四部分主要内容。 

 

4.  Attentive Relational Networks for Mapping Images to Scene Graphs (Mengshi Qi*, Weijian Li*, Zhengyuan Yang, Yunhong Wang and Jiebo Luo)

 

针对传统深度学习方法无法准确推测图像中各目标间上下文关系的问题,我们提出了一个新的注意力关系网络模型,所提模型可以根据既有语言学知识,将视觉表层特征和标签语义特征映射到一个共同空间中,并且赋予图结构中每个节点不同的注意力权重,最后通过关系推测网络生成图像的场景图表达。我们在国际权威数据库上进行了实验,结果表明了所提模型优于其他现有方法。