答辩公告
我的位置在: 首页 > 答辩公告 > 正文
向鸿鑫博士生预答辩公告
浏览次数:日期:2025-03-27编辑:

学位论文简介

分子视觉是一种以像素形式来表征分子的方法,它丰富了分子表征的形式并且不依赖于对分子领域知识的显示建模,具有广阔的应用前景。因此,本文以视觉渲染技术和基于计算机视觉的特征提取技术为主线,从药物不同视角的信息(如 2D 结构信息、 3D 几何信息、构象动态信息以及分子动力学模拟信息等)进行考虑,探索基于视觉的药物发现路径并提出一系列基于视觉的表征学习方法。取得了以下主要创新性研究成果:

(1) 针对现有分子表征学习方法在提取用于描述分子身份和分子生物学特征的信息向量方面准确性有限的问题,围绕分子的 2D 图像表示提出了一个具有化学意识的无监督分子图像预训练框架 ImageMol

(2) 针对基于图的方法在蛋白质-配体结合任务上存在表征能力受限、对最大原子长度敏感、以及缺乏分子动力学模拟指导的问题,提出了一种使用配体的多视角几何图像来学习蛋白质-配体结合表示的方法 ImagePLB

(3) 针对分子表征学习中分子的单模态信息有限以及多模态多样性不足的问题,充分考虑了三维几何构象分子图像中包含的丰富视觉信息(即纹理、阴影、颜色和平面空间信息)并提出了一种通用的图像增强的分子图表示学习框架 IEM 以及它的多构象改进版 IEM++

(4) 针对分子表征中分子几何构象表征能力受限的问题,提出了一种基于分子视频的分子表征学习基础模型 VideoMol

(5) 针对分子表征学习领域存在评估偏差、基准评估不全面以及不同模态分子表征偏好不明确等问题,导致各种分子模态的具体优势及其背后的关键因素尚不清楚。提出了一个通用的端到端基准测试平台 BenchMol 用于对现有基于不同模态的分子表征学习方法进行全面的评估和研究。

主要学术成果

[1] Xiang H, Jin S, Xia J, et al. An image-enhanced molecular graph representation learning framework[C]//Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence. 2024: 6107-6115. DOI: 10.24963/ijcai.2024/675. (第一作者,CCF A类会议)

[2] Xiang, H., Zeng, L., Hou, L. et al. A molecular video-derived foundation model for scientific drug discovery. Nat Commun 15, 9696 (2024). (第一作者,SCI一区)

[3] Zeng X, Xiang H, Yu L, et al. Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework[J]. Nature Machine Intelligence, 2022, 4(11): 1004-1016. (共一,导师第一作者SCI一区)

[4] Xiang H, Jin S, Liu X, et al. Chemical structure-aware molecular image representation learning[J]. Briefings in Bioinformatics, 2023, 24(6): bbad404. (第一作者,SCI二区)