答辩公告
我的位置在: 首页 > 答辩公告 > 正文
李波预答辩公告
浏览次数:日期:2019-04-04编辑:研究生教务办1

预答辩公告

论文题目

基于蛋白质相互作用网络的聚类算法研究与应用

答辩人

李波

指导教师

蔡立军

答辩委员会

主席

王树林

学科专业

计算机科学与技术

学院

信息科学与工程学院学院

答辩地点

信科院523

答辩时间

201943

下午230

学位论文简介

依托基因组学、蛋白质组学、代谢组学、调控网络等分析并收录的多类别多层次系统生物学基础数据,发展模型系统性的全方位模拟分析生物个体体内的所有组成成分包括蛋白质、基因、mRNA等发展变化的动力学过程,进而每个患者提供个性化的精准医疗将是未来的生物信息学发展趋势。 其中,基于蛋白质相互作用网络的聚类算法研究和应用是当前计算生物学领域的基础研究问题。

本课题研究主线基于蛋白质相互网络发展聚类算法进行通用蛋白质复合物识别以及疾病关联模块挖掘等应用研究,此外蛋白质复合物和疾病功能模块都与蛋白质的亚细胞位置信息息息相关,而当前该类数据并不完整且存在比例较高的假阳性,因而我们对蛋白质亚细胞定位预测这个问题也展开研究。总之,本课题的主要研究内容如下:

1)基于融合多视窗特征的蛋白质亚细胞定位研究。针对当前的蛋白质序列表示方法如氨基酸组成、伪氨基酸组成等难以充分挖掘残基与残基之间的交互信息和各残基的位置分布信息等缺陷,本文首先提出两种序列特征提取方法:一种是基于改进的混沌游戏模型提取的2维特征,侧重挖掘主序列的频率和全局位置分布信息;另一种则是基于统计信息理论表示的新3维特征,主要反映的是残基的局部位置信息。然后,设计一个基于5维特征和距离的分类模型,它优势在于不需要时间复杂度高的分类系统如SVM等,就能快速预测亚细胞位置,并且准确率超过部分基于SVM的分类模型。为更一步提高系统的预测准确率和可用性, 我们融合新5维特征,伪氨基酸组成和二肽特征并采用SVM作为分类系统,实验结果表明该多视窗模型预测效果显著超过几乎所有经典算法,这也间接地反应了两种新特征可以作为当前经典特征的有效补充。最后,部分蛋白质的亚细胞位置预测虽然被判定为假阳性,但是我们使用文本挖掘技术从权威期刊杂志验证了它们只是暂未被公开数据库所收录。

2)基于核心-附属结构蛋白质复合物挖掘算法研究蛋白质复合物是生物内执行细胞功能的主要载体,被证明绝大部分存在着核心-附属结构。针对蛋白质相互作用网络聚类算法存在的难以识别重叠模块、预测复合物的生物可解释性差等问题,本文提出一种挖掘核心-附属结构的蛋白质复合物的模型CFOCM,其先融合基因本体注释等定义一个新的亲和聚合函数,这能确保复合物核心既能有着内部稠密外部连通相对稀疏的拓扑结构且整体倾向于有着至少一个相同的生物功能,然后根据设定的亲近策略往复合物核心选择性添加外围蛋白质形成最终的复合物。该聚类模型在相对稀疏和稠密不同类型的网络数据集上F-mesure、预测数量等度量的表现都优于现有的算法(ClusterONEMCL, CORE, COACH等), 证实了算法的有效性和高适应性,此外对比实验也说明借助基因本体注释等满足核心拥有着至少同一共享功能这一假设有效地提高了算法的表现。

3) 基于多目标进化计算框架的疾病关联模块识别研究挖掘疾病关联的功能模块,有助于新药物靶标的筛选,揭秘复杂疾病的产生发展机制。当前对该方面研究成果相对较少,本文探索性的提出了一种基于多目标进化计算框架的疾病关联模块预测模型MPSOPC,多目标优化框架的优势在于能够同时优化平衡各个簇内部间的稠密度、簇与簇间连通性和模块内各蛋白质与某种疾病的紧密度等多个目标,给出一个最优解集,此外该模型还能充分挖掘网络的全局拓扑特性。实验结果证实,MPSOPC能识别簇内部稠密连通、簇与簇间连通相对稀疏的拓扑结构复合物,并且识别的些许复合物和某种类型疾病高度关联。此外,MPSOPC还具备运行效率高、鲁棒性强的特点,因而可以成为帮助识别发现潜在特定疾病致病基因集和新药物靶标的一个有效工具。


主要学术成果

[1] Li B, Liao B. Protein Complexes Prediction Method Based on Core—Attachment Structure and Functional Annotations[J]. International journal of molecular sciences, 2017, 18(9): 1910. ( SCI 中科院 JCR

[2] Li B, Cai L, Liao B, Xiangzheng Fu, Bing P, Yang J. Prediction of Protein Subcellular Localization Based on Fusion of Multi-view Features. Molecules. 2019; 24(5):919.SCI 中科院 JCR


上一篇:
孟涛预答辩公告
下一篇:
文兵答辩公告