答辩公告
我的位置在: 首页 > 答辩公告 > 正文
付浩龙博士生预答辩公告
浏览次数:日期:2024-03-12编辑:

学位论文简介

目标检测作为计算机视觉领域的重要研究方向,在自动驾驶、安防监控、机器人等领域具有广泛应用。然而,基于可见光的目标检测技术在光照不足、目标遮挡等情况下通常会出现性能急剧下降,对雨、雾和夜晚等弱光环境也较为敏感。因此,本文探索了可见光-红外融合目标检测方法,通过过结合多模态信息,提升了检测器在复杂环境下的适应能力和检测性能,拓展了其在智能机器人、自动驾驶、国防安全等方面的应用能力,取得了以下主要创新研究成果:

1)针对复杂光照场景,本文一种特征增强的远程注意力融合网络,通过融合增强的可见光和红外特征的远程依赖性来提高检测性能。

2)针对遮挡环境,本文提出了一种监督式多模态特征交互学习网络,通过提高输入单模态特征的内在质量,在遮挡环境下取得了优越的性能。

3)针对数据采集导致的可见光-红外弱对齐问题,本文提出了一种端到端无对齐跨模态融合可变形Transformer检测器,极大地增强了检测器面对弱对齐数据的效率。

4)针对可见光-红外非对齐数据,本文提出了一种快速单级探测器,在特征提取过程中采用特征级对齐,保证了检测器具有较高的检测效率。

5)基于以上研究内容在真实环境中展开了实验验证,实验结果表明,本文提出的方法在真实环境中具有良好的检测性能,并对真实环境中的数据偏差和弱对齐现象也具备很好的适应能力。


主要学术成果

[1] Fu H(付浩龙), Wang S, Duan P, et al. LRAF-Net: Long-Range Attention Fusion Network for VisibleInfrared Object Detection[J]. IEEE Transactions on Neural Networks and Learning Systems, 2023. (中科院一区TopCCF B)

[2] Fu H(付浩龙), Li Q, Duan P, et al. Dual-Attention-Driven Multiscale Fusion Object Searching Network for Remote Sensing Imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2022, 15: 8131-8141. (中科院二区Top)

[3] Fu H(付浩龙), Liu H, Yuan J, et al. YOLO-Adaptor: A Fast Adaptive One-Stage Detector for Non-Aligned Visible-Infrared Object Detection[J]. IEEE Transactions on Intelligent Vehicles. (Minor Revision,中科院一区)

[4] Fu H(付浩龙), Yuan J, et al. CF-Deformable DETR: an End-to-end Alignment-free Model for Weakly Aligned Visible-infrared Object Detection[C]. International Joint Conference on Artificial Intelligence. (Submmited, Second RoundCCF A会议)

[5] Fu H(付浩龙), Yuan J, et al. SMFII-Net: Supervised Multi-modal Feature Interaction Learning Network for Visible-infrared Object Detection[J]. Knowledge Based Systems. (Major Revision,中科院一区)

[6] Chen J, Lin J, Xiao Z, Fu H(付浩龙), et al. EPCFormer: Expression Prompt CollaborationTransformer for Universal ReferringVideo Object Segmentation, IEEE Transactions on Circuits and Systems for Video Technology, Under Review. (Minor Revision,中科院一区TopCCF B)

[7] He X, Yuan J, Yang F, Yang K, Lin J, Fu H(付浩龙), et al. SSD-MonoDETR: Supervised Scale-aware Deformable Transformer for Monocular 3D Object Detection[J]. IEEE Transactions on Intelligent Vehicles. 2023. (中科院一区)

[8] Xiao Z, Lin J, Chen J, Fu H(付浩龙), et al. BIVPPNet: Balanced Interactive Visual Privacy Preservation Network[J]. Neurocomputing. (Minor Revision,中科院二区Top)