答辩公告
我的位置在: 首页 > 答辩公告 > 正文
王萌博士生预答辩公告
浏览次数:日期:2025-06-06编辑:


学位论文简介

自动驾驶技术正在成为推动交通系统智能化、绿色化发展的核心力量。其中,感知系统作为自动驾驶系统的第一层决策基础,其精度、实时性和鲁棒性直接决定了整车的安全性与可控性。本论文围绕“面向自动驾驶复杂场景的视觉感知关键技术研究”展开,针对当前视觉感知系统在自动驾驶实际应用中存在的语义模糊、深度不准、遮挡严重、动态建模困难及恶劣天气下鲁棒性差等问题,系统开展了图像驱动的三维语义建模与深度感知技术研究。本研究的主要创新点包括:

(1) 提出基于前向-反向双投影融合的语义场景补全方法,构建稀疏-密集体素互补机制,有效提升遮挡区域和远距离场景的几何表达与语义一致性。

(2) 引入预训练视觉语言模型作为高层语义先验,设计语义蒸馏机制增强图像特征表达能力,提升稀疏区域、类间边界处的三维语义辨识精度。

(3) 结合光流信息构建时间-空间上下文,提出跨帧动态对齐与遮挡建模模块,实现对动态目标结构的连续建模,增强模型对时序一致性的表达。

(4) 设计掩码重建辅助分支模拟雨雾遮挡环境,引导网络从上下文推理可见性与纹理,提升深度估计模型在恶劣天气下的鲁棒性与细节感知能力。

(5) 提出动静态分支结构与自适应融合机制,结合单目与立体深度优点,实现动态物体与静态背景的结构解耦与语义互补,显著提升建模精度与鲁棒性

主要学术成果

[1] Meng Wang, Yunchuan Qin, Ruihui Li, Zhizhong Liu, Zhuo Tang, Kenli Li. AWDepth: Monocular Depth Estimation for Adverse Weather via Masked Encoding [J]. IEEE Transaction on Industrial Informatics, 2024, 20(8):10873-10882.(SCI-1区,本人为第一作者)

[2] Meng Wang, Yan Ding, Yumeng Liu, Yunchuan Qin, Ruihui Li, Zhuo Tang. MixSSC: Forward-Backward Mixture for Vision-based 3D Semantic Scene Completion[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2025, Early Access.(SCI-1区,本人为第一作者)

[3] Meng Wang, Huilong Pi, Ruihui Li, Yunchuan Qin, Zhuo Tang, Kenli Li. VLScene: Vision-Language Guidance Distillation for Camera-Based 3D Semantic Scene Completion[C]. Proceedings of the AAAI Conference on Artificial Intelligence. 2025, 39(8): 7808-7816.(CCF-A类会议,本人为第一作者)

[4] Meng Wang, Fan Wu, Ruihui Li, Yunchuan Qin, Zhuo Tang, Kenli Li. Learning Temporal 3D Semantic Scene Completion via Optical Flow Guidance. NeurIPS 2025.(CCF-A类会议审稿中,本人为第一作者)

[5] Meng Wang, Fan Wu, Yunchuan Qin, Ruihui Li, Zhuo Tang, Kenli Li. Vision-based 3D Semantic Scene Completion via Capture Dynamic Representations. Knowledge-Based Systems. 2025.(SCI-1区返修中,本人为第一作者)