
学位论文简介
蛋白质磷酸化是最重要、最广泛的翻译后修饰之一,通过精细调控蛋白质—蛋白质相互作用(Protein–Protein Interactions,PPIs),在细胞信号转导、功能调节及疾病发生发展中发挥核心作用。磷酸化对PPI的调控并非简单的开关效应,而是呈现出显著的位点特异性、调控方向差异性及跨尺度依赖特征,其调控结果往往通过重塑PPI网络结构间接驱动复杂疾病表型。然而,磷酸化调控PPI的过程涉及多源异构生物数据、高维非线性特征以及跨分子—网络—疾病层级的复杂关联,现有实验手段与静态分析方法难以在系统层面刻画其动态调控机制,计算方法亦普遍存在数据支撑不足、特征建模受限及机制可解释性不足等问题。如何发展面向蛋白质磷酸化调控蛋白质相互作用机制的智能计算方法,实现对调控效应的精准建模、关键位点识别及致病机制的可预测分析,已成为分子调控机制研究中的关键科学问题。近年来,深度学习技术在蛋白质序列与结构建模中的突破为该问题提供了新的技术路径。基于此,本文以蛋白质序列与结构信息为基础,以深度学习方法为核心,围绕磷酸化调控PPI 的效应预测、调控方向判别、结合位点识别及致病性判定等关键任务,系统研究蛋白质磷酸化调控蛋白质相互作用机制的智能分析方法。本文研究工作包括以下四个方面:
(1)提出了一种面向磷酸化影响蛋白质相互作用预测的深度学习智能方法。
针对磷酸化调控蛋白质相互作用过程中功能性磷酸化位点样本稀缺、调控效应复杂且难以精准建模的挑战,构建了首个公开的、包含实验验证的功能性磷酸化位点数据集,并在此基础上设计了一种基于注意力机制的深度学习预测方法。该方法以蛋白质序列为输入,围绕潜在发生磷酸化的 S/T/Y 位点设计滑动窗口策略,引入预训练蛋白质语言模型获取序列的上下文语义与进化特征表示,通过卷积神经网络结合注意力机制自动学习磷酸化位点及其邻域序列的关键判别特征,有效刻画磷酸化对蛋白质相互作用产生调控效应的潜在模式,实现了对功能性磷酸化位点的高精度预测。实验结果表明,该方法在多项评价指标上均优于现有方法,为系统解析磷酸化影响蛋白质相互作用的分子机制提供了可靠的数据基础和计算工具。
(2)本文提出了一种面向磷酸化调控蛋白质相互作用方向分类的深度学习智能方法。
针对磷酸化对蛋白质相互作用产生增强或抑制等不同调控方向时,现有方法在建模上下文依赖关系不足、样本分布不均衡以及泛化能力受限等问题,构建并公开了一个包含实验验证的磷酸化调控 PPI 方向信息的数据集。在此基础上,提出了一种融合注意力机制卷积神经网络与 Transformer 的集成学习框架,从局部序列模式与全局长程依赖两个层面联合建模磷酸化位点的调控特征。该方法通过自适应加权损失策略缓解类别不平衡对模型训练的影响,有效提升了对不同调控方向的判别能力。实验结果表明,所提出的方法在多项评价指标上均优于现有方法,能够更加准确地刻画磷酸化对蛋白质相互作用的调控方向,为深入理解磷酸化介导的分子调控机制提供了有效的计算手段。
(3)提出了一种面向蛋白质相互作用结合位点预测的双路径深度学习智能方法。
针对现有方法在蛋白质序列空间位置信息利用不足、多尺度特征刻画能力有限以及长程依赖建模不充分等问题,构建了一种双路径协同建模的预测框架,从“序列全局依赖建模”和“局部多尺度特征表达”两个互补视角对蛋白质序列进行联合表征。该方法通过并行建模蛋白质序列的局部空间结构特征与全局上下文依赖关系,有效提升了对 PPI 结合位点的精细刻画能力。同时,引入多尺度特征提取与空间位置信息建模机制,增强模型对不同尺度结合界面的适应性。实验结果表明,所提出的双路径方法在多项评价指标上均优于现有主流方法,能够更加准确地识别蛋白质相互作用结合位点,为深入理解蛋白质相互作用机制提供了有效的计算支持。
(4)提出了一种面向磷酸化调控蛋白质相互作用致病性判定的多模态智能预测框架。
针对现有研究难以系统刻画“磷酸化—PPI—致病性”跨层级因果关联的问题,构建了首个系统化的磷酸化调控 PPI 致病性基准数据集,并提出了一种多模态融合的智能判定方法。该方法以蛋白质磷酸化事件为起点,联合蛋白质序列信息与生物医学文本知识,引入蛋白质语言模型与大语言模型进行协同建模,通过跨模态特征对齐与融合学习,刻画磷酸化事件经由蛋白质相互作用调控进而引发致病效应的潜在生物学逻辑。进一步结合基于思维链的推理机制,引导模型显式建模磷酸化调控 PPI 并导致疾病发生的因果路径,实现对磷酸化调控 PPI 致病性的精准、可解释判定。实验结果表明,该方法在致病性预测性能与解释能力上均优于现有方法,为解析磷酸化调控蛋白质相互作用的致病机制提供了新的计算框架与技术支撑。
主要学术成果
Gong Y, Li R, Liu Y, et al. DeepPhosPPI: a deep learning framework with attention-CNN and transformer for predicting phosphorylation effects on protein–protein interactions[J]. Briefings in Bioinformatics, 2025, 26(5): bbaf462. (BIB, SCI一区, 本人为第一作者,已发表)
Gong Y, Li R, Fu B, et al. A CNN-LSTM ensemble model for predicting proteinprotein interaction binding sites[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2023, 20(6): 3588-3599 (TCBB, CCF B, 本人为第一作者,已发表)
Gong Y, Li R, Liu Y, et al. MR2CPPIS: Accurate prediction of protein–protein interaction sites based on multi-scale Res2Net with coordinate attention mechanism[J]. Computers in Biology and Medicine, 2024, 176: 108543. (CIBM,本人为第一作者,已发表)
Yan L U, Gong Y, Luo Q, et al. Heterologous expression of fungal AcGDH alleviates ammonium toxicity and suppresses photorespiration, thereby improving drought tolerance in rice[J]. Plant Science, 2021, 305: 110769. (SCI二区,本人为并列第一作者,已发表)