答辩公告
我的位置在: 首页 > 答辩公告 > 正文
翟亚静博士生预答辩公告
浏览次数:日期:2024-04-11编辑:

学位论文简介


行人重识别是智慧安防、智能视频监控的重要组成部分。其目标是从大量的跨摄像头图像或者视频序列中快速、准确地找出不同时刻是否存在特定行人它的高效性和有效性不仅加速了视频分析的进程,节省了大量的人力、物力和财力,也为公共安全和社会治安提供了有力支持。因此,本文致力于多模态行人重识别研究。具体而言,主要研究内容归纳如下:

(1) 针对如何综合考虑不同模态的行人信息这一问题,本文提出了基于生成描述的行人重识别方法。将素描图像看作“桥”连接,充分利用与文本和真实图像的互补信息,与文本描述一起来检索图库中的行人图像,以使其更符合现实应用场景。

(2) 针对目前的行人重识别算法通常没有充分利用细粒度属性及丰富的上下文信息问题,本文提出了基于多提示学习的行人重识别方法,探讨了提示学习、现成大模型和视觉问答多维度下来获得潜在的与行人相关的线索,以充分利用细粒度属性辅助行人重识别任务。

(3) 针对现有行人重识别方法在面对广泛的场景时性能下降问题本文提出了一个面向更现实场景的多风格行人重识别数据集并设计了一个基于多风格适应的行人重识别框架来处理多风格描述差异,弥合不同风格描述数据之间的语义差距,从而适用于多场景下的行人重识别任务。



主要学术成果

[1] Yajing Zhai, Yawen Zeng, Da Cao, and Shaofei Lu. TriReID: Towards Multi-Modal Person Re-Identification via Descriptive Fusion Model[C]. In Proceedings of the International Conference on Multimedia Retrieval, 2022, pp. 63-71. (CCF B, 第一作者)

[2] Yajing Zhai, Yawen Zeng, Zhiyong Huang, Zheng Qin, Xin Jin, and Da Cao. Multi-Prompts Learning with Cross-Modal Alignment for Attribute-Based Person Re-identification[C]. In Proceedings of the AAAI Conference on Artificial Intelligence, 2024, Vol. 38, No. 7, pp. 6979-6987. (CCF A, 第一作者)

[3] 曹达翟亚静曾雅文、陆绍飞. 生成描述多模态行人重识别方法、装置及电子设备. 专利号:ZL202110834682.6, 2021, (授权, 第二作者)