
学位论文简介
人脸识别作为计算机视觉领域的一个典型任务,充分受益于深度神经网络技术的发展,识别水平获得了极大的提升。然而,人脸识别作为一个科学问题,依然在诸多方面面临挑战。本学位论文聚焦于无约束条件下高精度人脸识别方法研究,包括高精度的人脸识别算法以及轻量人脸识别网络的研究。本文的主要创新性研究成果如下:
(1) 为了应对人脸识别中数据不平衡问题,提出了一种基于间隔 Softmax 损失的类内难例挖掘方法,该方法通过设计一个简单、有效的难例选择函数,在模型训练过程中实现在线难正例的筛选。该方法的优点在于训练迭代过程中能够快速、明确的找出类内难分的样本(误分类样本),不显著增加计算以及内存资源消耗,对训练的进程几乎没有影响。
(2) 针对基于角度/余弦间隔的 Softmax 损失方法缺乏直接对类内距离优化导致识别性能受限问题,提出了一个基于间隔 Softmax 类内难例挖掘损失函数用于人脸识别,通过优化难例特征向量与其地标真值类权重向量之间的角度,使得模型能够获得更加紧凑的人脸类内特征分布,从而达到提升模型识别精度的目标。
(3) 针对人脸识别在面对跨年龄、跨姿态、遮挡、表情、模糊场景时性能急剧下降的问题,从类内难例的统一视角出发,提出了一种难度自适应间隔 Softmax 损失人脸识别方法,以单一模型统一应对各种人脸类内变化造成的人脸识别困难问题。所提方法在多个流行的跨年龄、跨姿态、混合变化以及通用的人脸测试基准上实现了 SOTA 水平。
(4) 为了实现高精度、轻量化人脸识别模型在嵌入式设备端的部署应用,提出了一种多尺度高效瓶颈结构,并在此基础上提出了一系列用于人脸识别的高精度多尺度高效轻量人脸识别网络模型。所提的方法是首个在八大流行人脸测试基准上进行全面测试评估、并接近基于深层 ResNet 网络构建的 SOTA 模型的轻量人脸识别方法,在人脸识别的精度、推理延时上能够做到很好的平衡。
主要学术成果
[1] Degui Xiao, Jiazhi Li, Jianfang Li, Shiping Dong, Tao Lu. IHEM Loss:Intra-class HardExample Mining Loss for Robust Face Recognition. IEEE Transactions on Circuits and Systems for Video Technology, 2022, 32(11): 7821-7831. (中科院SCI一区,导师一作,已发表).
[2] Jiazhi Li, Degui Xiao, Tao Lu, Yuqi Wei, Jia Li and Lei Yang. Hardness Adaptive Margin Loss for Face Recognition with Various Intra-class Variations. Expert Systems with Applications. (中科院SCI一区,已接收).
[3] Jiazhi Li, Degui Xiao, Tao Lu, and Shiping Dong. MEFaceNets: Muti-scale Efficient CNNs for Real-time Face Recognition on Embedded Devices. The 2023 International Conference on Neural Information Processing (ICONIP2023). (CCF C类会议,已接收)
[4] Degui Xiao, Lu Zhang, Jianfang Li, Jiazhi Li. Robust license plate detection and recognition with automatic rectification. Journal of Electronic Imaging, 194(2020), 105584. (中科院SCI四区,已发表).
[5] Degui Xiao, Lin Zhuo, Jianfang Li, Jiazhi Li. Structure-prior deep neural network for lane detection. JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION, 2021, 81:(103373)1-10 (中科院SCI三区,已发表).
[6] Degui Xiao , Jiahui Liu , Jiazhi Li. FALNet: flow-based attention lightweight network for human pose estimation[J]. Journal of Electronic Imaging, 2023, 32(5): 053008-053008.(中科院SCI四区,已发表).