答辩公告
我的位置在: 首页 > 答辩公告 > 正文
王小奇博士生答辩公告
浏览次数:日期:2023-05-15编辑:



学位论文简介

近些年来,随着生物医药数据的爆炸性增长,以深度学习为代表的人工智能技术正在推动着药物研发的技术变革,尤其是基于生物网络的表征学习技术在药物发现领域中显示出了广阔的应用前景,但是由于生物网络中多元实体之间的多层次关系、多尺度语义、多视图信息以及稀疏的标签,导致基于表征学习的药物发现面临预测精度低、模型过拟合、泛化能力差等诸多挑战。因此,本文基于复杂的生物异质网络数据,研究多视图的网络表征学习进行精准药物发现。

1)针对药物和细胞系以及它们内部特征之间的多层次关系,提出一种基于多视图深度注意网络的抗癌药物反应预测方法MultiDRP。通过利用细胞系网络和药物网络驱动图注意模型捕获实体之间的外部关系;利用多头自注意力网络来增强学习生物实体内部特征项之间的依赖关系。针对肺癌细胞系NCI-H23,预测的八种药物在体外细胞实验中表现出了高敏感值,其中7种药物的IC50值小于10nM

2)针对抗新冠炎症有效的药物数据不足以及不同实体之间的异质性,本文提出基于生物网络表征学习的抗新冠炎症药物重定位方法DeepR2cov。该研究提出了基于路径实体掩码的自监督表征算法学习生物实体之间的复杂语义关系,提升药物-靶标相互作用预测的精度;最终,预测了22种潜在的候选药物,并通过文献数据、临床报告和分子对接技术分析验证了候选药物的抗炎机理以及分子之间的绑定模式。

3)针对生物网络中实体之间不同尺度的语义特征和自监督学习中的负迁移现象,本文提出一种基于局部-全局表征融合的生物链路预测方法BioERP。通过七个数据集的实验结果表明BioERP的链路预测精度优于现有的28种基准方法。

4)针对如何利用多任务学习框架集成多个自监督表征模型优化分子表征的问题,本文提出了基于生物异质网络的多任务自监督分子表征方法MSSL2drug。基于生物异质网络的结构、语义和属性,设计了六个自监督任务以及15种多任务组合;提出了基于图注意力的多任务对抗学习框架生成分子表征,并系统地评估不同的多任务自监督模型在药物发现应用中的差异性。最终发现多视图的自监督任务组合能够获得最高的药物预测性能。

主要学术成果

[1] Xiaoqi Wang, Yingjie Cheng, Yaning Yang, et al. Multi-task Joint Strategies of Self-supervised Representation Learning on Biomed-ical Networks for Drug Discovery [J]. Nature Machine Intelligence. 2023,5:445-456 (SCI 1区,IF=25.90).

[2] Xiaoqi Wang, Bin Xin, Weihong Tan, et al. DeepR2cov: deep representation learning on heterogeneous drug networks to discover anti-inflammatory agents for COVID-19 [J]. Briefings in Bioinformatics. 2021,22(6):bbab226 (CCF BIF=13.99).

[3] Xiaoqi Wang, Yaning Yang, Kenli Li, et al. BioERP: biomedical heterogeneous network-based self-supervised representation learning ap-proach for entity relationship predictions [J]. Bioinformatics. 2021,37(24):4793-4800 (CCF BIF=6.93).

[4] Hong Wang, Xiaoqi Wang, Wenjuan Liu, et al. deepDGA: Biomedical Heterogeneous Network-based Deep Learning Framework for Disease-Gene Association Predictions [C]. IEEE International Conference on Bioinformatics and Biomedicine (BIBM). 2022601-606 (CCF B,共同第一作者).