王萌博士生预答辩公告-湖大计算机学院

我的位置在：首页 > 答辩公告 > 正文

王萌博士生预答辩公告

浏览次数:日期：2025-06-06编辑：

学位论文简介

自动驾驶技术正在成为推动交通系统智能化、绿色化发展的核心力量。其中，感知系统作为自动驾驶系统的第一层决策基础，其精度、实时性和鲁棒性直接决定了整车的安全性与可控性。本论文围绕“面向自动驾驶复杂场景的视觉感知关键技术研究”展开，针对当前视觉感知系统在自动驾驶实际应用中存在的语义模糊、深度不准、遮挡严重、动态建模困难及恶劣天气下鲁棒性差等问题，系统开展了图像驱动的三维语义建模与深度感知技术研究。本研究的主要创新点包括：

(1) 提出基于前向-反向双投影融合的语义场景补全方法，构建稀疏-密集体素互补机制，有效提升遮挡区域和远距离场景的几何表达与语义一致性。

(2) 引入预训练视觉语言模型作为高层语义先验，设计语义蒸馏机制增强图像特征表达能力，提升稀疏区域、类间边界处的三维语义辨识精度。

(3) 结合光流信息构建时间-空间上下文，提出跨帧动态对齐与遮挡建模模块，实现对动态目标结构的连续建模，增强模型对时序一致性的表达。

(4) 设计掩码重建辅助分支模拟雨雾遮挡环境，引导网络从上下文推理可见性与纹理，提升深度估计模型在恶劣天气下的鲁棒性与细节感知能力。

(5) 提出动静态分支结构与自适应融合机制，结合单目与立体深度优点，实现动态物体与静态背景的结构解耦与语义互补，显著提升建模精度与鲁棒性。

主要学术成果

[1] Meng Wang, Yunchuan Qin, Ruihui Li, Zhizhong Liu, Zhuo Tang, Kenli Li. AWDepth: Monocular Depth Estimation for Adverse Weather via Masked Encoding [J]. IEEE Transaction on Industrial Informatics, 2024, 20(8):10873-10882.(SCI-1区，本人为第一作者)

[2] Meng Wang, Yan Ding, Yumeng Liu, Yunchuan Qin, Ruihui Li, Zhuo Tang. MixSSC: Forward-Backward Mixture for Vision-based 3D Semantic Scene Completion[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2025, Early Access.(SCI-1区，本人为第一作者)

[3] Meng Wang, Huilong Pi, Ruihui Li, Yunchuan Qin, Zhuo Tang, Kenli Li. VLScene: Vision-Language Guidance Distillation for Camera-Based 3D Semantic Scene Completion[C]. Proceedings of the AAAI Conference on Artificial Intelligence. 2025, 39(8): 7808-7816.(CCF-A类会议，本人为第一作者)

[4] Meng Wang, Fan Wu, Ruihui Li, Yunchuan Qin, Zhuo Tang, Kenli Li. Learning Temporal 3D Semantic Scene Completion via Optical Flow Guidance. NeurIPS 2025.(CCF-A类会议审稿中，本人为第一作者)

[5] Meng Wang, Fan Wu, Yunchuan Qin, Ruihui Li, Zhuo Tang, Kenli Li. Vision-based 3D Semantic Scene Completion via Capture Dynamic Representations. Knowledge-Based Systems. 2025.(SCI-1区返修中，本人为第一作者)

下一篇：: 王志毅博士生预答辩公告