学位论文简介
本文以复杂疾病为研究对象,开发有效的计算模型用于疾病诊断、预后、微生物标志物发现、药物重定位研究,从而更好地了解致病机理,为早期发现疾病并获得新的药物治疗方案提供支持。本文主要内容和创新点如下:
针对现有复杂疾病诊断模型的预测性能和泛化性有待提升的问题,本文设计了一个基于二次学习概率误差集成的疾病诊断框架HoloDiagnostic,在肺癌、乳腺癌、肝癌和COVID-19诊断实验中验证,开发了中医辨证模型“扁鹊”。最终,实现HoloDiagnostic落地应用。
针对疾病预后预测当前临床可解释性不足的问题,本文提出了一种深度解释学习的疾病预后预测方法HPExplainPro,在肺癌、乳腺癌、肝癌和COVID-19预后预测实验中验证,开发了中西医预后预测模型“仲景”。最后,实现HPExplainPro落地应用。
针对疾病-微生物关联关系分析缺乏充分的湿实验验证的问题,本文设计了一个干湿闭环实验的疾病-微生物关联关系研究范式。首先,本文提出了一个嵌入注意力机制的图卷积网络预测疾病-微生物关联关系模型(GCNN4Micro-Dis)。通过干实验研究,在HMDAD、Disbiome验证。然后,设计了动物湿实验验证,GCNN4Micro-Dis发现的潜在疾病微生物标志物。
针对药物重定位研究大都采用多分类方法,使得预测的数量相对固定而无法全面揭示药物潜在的适应症的问题,本文提出了一个生成式AI的药物重定位模型框架GenDrugShifter,在西药重定位和中药重定位模型“时珍”中证实了其准确性。最后,通过临床数据验证了实验发现。
主要学术成果
[1] Graph neural network and multi-data heterogeneous networks for microbe-disease prediction. Frontiers in Microbiology. 2022, DOI: 10.3389/fmicb.2022.1077111. (中科院小类SCI-2区,TOP期刊,JCR-Q1,IF:6.064)[部分对应第5章研究内容, 本人一作]
[2] An interpretable artificial intelligence model of chinese medicine treatment based on XGBoost algorithm. In:2020 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE, 2020: 1550-1554. DOI: 10.1109/BIBM49941.2020.9313424. (CCF B类会议)[部分对应第3章研究内容, 本人一作]
[3] An Automatic Clinical Model for Chinese Medicine Based on Interpretable Machine Learning Algorithms. Proceedings of BIBM 2021, DIO:10.1109/BIBM52615.2021.9669304 (CCF-B类会议)[部分对应第4章研究内容, 本人一作]
[4] Exploring Disease-Associated Microbial Signatures through Integrated Dry-Wet Loop Assays. (under review,EBiomedicine,SCI-1区)[部分对应第5章研究内容, 本人一作]
[5] HPExplainPro: A framework for pan-cancer prognosis prediction based on deep interpretive learning.(已投稿,KDD2024, CCF A)[部分对应第4章研究内容, 本人一作]
[6] 融合GHP与GCN的中西药物重定位方法及系统与存储介质.(专利号:CN202111658146.1,授权公告号:CN114242186B,2022-08-12)[部分对应第6章研究内容, 导师一作,本人二作]
[7] 一种具有可解释性的高性能预测模型构建方法及其系统.(专利号:CN202311733337.9,2023-12-15,进入实审)[部分对应第4章研究内容, 导师一作,本人二作]
[8] Risk factors and drug discovery for cognitive impairment in type 2 diabetes mellitus using artificial intelligence interpretation and graph neural networks . Frontiers in Endocrinology, 2023, 141213711-1213711. DOI: 10.3389/fendo.2023.1213711. (中科院SCI-2区)[部分对应第5章研究内容, 本人通讯]
[9] An Explainable AI Approach for the Rapid Diagnosis of COVID-19 Using Ensemble Learning Algorithms. Frontiers in Public Health. 2022, Vol. 10: 874455. DOI: 10.3389/fpubh.2022.874455.(中科院SCI-3区收录,JCR-Q1,IF:6.461)[部分对应第3章研究内容, 本人一作]