学位论文简介
生物医学和信息领域一直致力于研究与人类疾病相关的问题。随着“人类基因组计划”完成以及高通量测序技术的发展,非编码RNA的生物学功能逐渐被成功鉴定。目前,在转录组分子水平探索疾病致病机制是当前生物医学领域的研究热点之一。深入研究非编码RNA与疾病、基因及蛋白质之间的潜在关联和相互作用,对挖掘疾病的发病机制,发现新的药物靶点和研发疾病治疗药物具有重要意义。然而,传统低通量生物实验面临诸如周期长、风险高、成本大等挑战,因此采用计算机技术来预测非编码RNA的潜在关联和相互作用成为了一种经济有效的辅助手段。本文主要关注生物分子网络,以调控性miRNA和具有临床潜力的lncRNA为主要研究对象。利用计算机技术和机器学习手段,充分挖掘海量生物数据,开发有效的计算模型来预测miRNA、lncRNA与疾病的潜在关联,以及lncRNA与蛋白质之间的相互作用。
本文主要工作概述如下:
提出一个利用多路复用网络融合多视图数据,并在三方异构的miRNA-基因-疾病网络上随机游走,预测miRNA-疾病关联的Tri-HM-RWR模型。
提出一个利用MCS多核学习来融合多视图相似度基核,并通过核范式谱正则化矩阵完成预测lncRNA-疾病关联预测的MCS-SRMCLDA模型。
在MCS-SRMCLDA的基础上,提出一个利用中心核对齐CKA融合多视图相似度基核,利用集成相似度分别构建lncRNA和疾病超图,通过逻辑矩阵完成来预测lncRNA-疾病关联的CKA-HRLMF模型。
提出了一个利用快速核学习FKL来融合多个相似度和特征基核,并通过图卷积网络预测lncRNA-蛋白质相互作用的LPI-FKLGCN模型。
主要学术成果
W. Li, S. Wang, J. Xu, and J. Xiang, Inferring Latent MicroRNA-Disease Associations on A Gene-Mediated Tripartite Heterogeneous Multiplexing Network [J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2022.(第一作者,CCF B类推荐,中科院SCI-3区收录,IF:3.702)
W. Li, S. Wang, and J. Xu, An Ensemble Matrix Completion Model for Predicting Potential Drugs Against SARS-CoV-2 [J]. Frontiers in Microbiology,2021, 12: 1959.(第一作者,中科院SCI-2区收录,TOP期刊,IF:6.064)
W. Li, S. Wang, J. Xu, G. Mao, G. Tian, and J. Yang, Inferring Latent Disease-lncRNA Associations by Faster Matrix Completion on a Heterogeneous Network [J]. Frontiers in Genetics, 2019, 10: 769.(第一作者,中科院 SCI-3区收录,IF:4.772)
W. Li, S. Wang, and H. Guo, “LPI-FKLGCN: Predicting LncRNA-Protein Interactions Through Fast Kernel Learning and Graph Convolutional Network,” [C]. Bioinformatics Research and Applications. ISBRA 2021. Lecture Notes in Computer Science, vol 13064.(第一作者,CCF C类推荐,EI)
W. Li, S. L. Wang, J. Xu, and J. Yang, “Identification of Human LncRNA-Disease Association by Fast Kernel Learning-Based Kronecker Regularized Least Squares,” [C]. Intelligent Computing Theories and Application. ICIC 2020. Lecture Notes in Computer Science, vol 12464. (第一作者,CCF C类推荐,EI)