答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈一凡博士生预答辩公告
浏览次数:日期:2022-11-25编辑:

学位论文简介

基因组被誉为生命之书,大自然通过生物序列书写描绘整个生命过程。生物序列为人类从分子水平上了解生命本质提供了原始的支撑。核酸和蛋白质是两类最重要的生物大分子。核酸和蛋白质分子序列种类繁多,但序列组成结构却高度相近,不同序列的表征编码方式基本相同。当前,COVID-19大流行正严重影响人们日常生活,开发抗冠状病毒药物迫在眉睫,应用序列表征学习策略开发抗冠状病毒多肽(anti-coronavirus peptide,简称ACVP)预测模型有助于抗新冠病毒药物的研发。因此,本论文从核酸和蛋白质序列中选择几种典型的分子作为生物序列表征学习的研究对象,包括了植物R蛋白(蛋白质)mRNA(核酸)ncRNA-蛋白质(核酸-蛋白质)相互作用及ACVP序列,以传统特征工程、静态表示、动态预训练表示以及自动化特征工程为技术手段,对生物大分子的序列表征学习进行了研究。主要开展的研究内容概述如下:

(1)提出了基于成对能含量的植物R蛋白预测模型。首先从氨基酸残基的成对能量含量中获得植物R蛋白的特征信息;然后,将获得的特征信息输入堆叠框架进行训练,构建植物R蛋白的预测模型。五折交叉验证和独立测试验证的结果都表明,StackRPred方法优于其他最先进的方法,表明所提方法是预测植物R蛋白的有效工具。

(2)提出了基于多尺度自注意力机制mRNA亚细胞定位预测模型,名为mRNA-CLA,用于预测多标签的mRNA亚细胞定位。该模型通过多尺度卷积层获得不同位置的序列特征,并利用自注意力层对每个序列产生的自注意得分,结合CNN层中提取位置权重矩阵,提供可解释的模型分析。特别是对不同位置的mRNA序列进行序列碱基分析,得到不同位置的序列的碱基特异性。从评估结果来看,mRNA-CLA总体上优于现有方法和工具。

(3)提出了基于图表征学习和社区检测的ncRNA-蛋白质相互作用预测模型。首先利用两组标签来区分两种不同类型的节点:ncRNA和蛋白质,从而缓解了图网络中过度耦合的问题。随后,根据图中节点的社区所有权关系,初步优化ncRNA和蛋白质的表征。此外,该模型应用了一种自注意力机制来保留图的拓扑结构,以减少池化过程中的信息损失。实验结果表明,所提出的模型性能要优于现有预测模型。

(4)提出了基于自动化特征工程的ACVP预测模型。现有的AVP预测方法多是凭经验选择特征信息和预测模型,容易产生主观偏差且不易规模化推广,因此,本论文引入自动化特征工程来选择特征和模型的最佳组合。首先应用传统特征工程、静态表示以及动态预训练模型对抗病毒肽序列进行多视角表征学习,引入贝叶斯技术优化搜索空间(特征信息和多种机器学习模型)以选择特征和模型的最佳组合。通过构建自动化的机器学习模型,能有效避免人工经验这种低效的经验方式选择机器学习模型,有助于规模化推广。

主要学术成果

  1. Chen Yifan, Li Zejun, Li Zhiyong. Prediction of Plant Resistance Proteins Based on Pairwise Energy Content and Stacking Framework[J]. Frontiers in Plant Science, 2022, 13. (SCI )

  2. Zhuo Linlin, Chen Yifan*, Song Bosheng, et al.. A model for predicting ncRNA–protein interactions based on graph neural networks and community detection[J]. Methods, 2022, 207: 74-80. (SCI )

  3. Chen Yifan, Fu Xiangzheng, Li Zejun, et al. Prediction of lncRNA–protein interactions via the multiple information integration[J]. Frontiers in Bioengineering and Biotechnology, 2021, 9: 647113. (SCI )

  4. Chen Yifan, Chen Shaomiao, Li Kuan-Ching, Liang Wei, Li Zhiyong. DRJOA: Intelligent Resource Management Optimization through Deep Reinforcement Learning Approach in Edge Computing[J]. Cluster computing, 2022, Accepted. (SCI )

  5. Chen Yifan, Li Zhiyong, Yang Bo, et al. A Stackelberg game approach to multiple resources allocation and pricing in mobile edge computing[J]. Future Generation Computer Systems, 2020, 108: 273-287. (SCI )