答辩公告
我的位置在: 首页 > 答辩公告 > 正文
白亮博士生答辩公告
浏览次数:日期:2025-06-23编辑:李晓鸿

学位论文简介

基因调控网络(Gene Regulatory Network, GRN)是遗传物质间的复杂相互作用,决定了细胞在生物体内的发育过程以及其对环境变化的响应,是研究细胞分化与重编程中的关键领域。为了更加深入地探讨基因调控网络中各个遗传元素之间的相互作用复杂性,响应“十四五”国家重点研发计划对“前沿生物技术”发展的推动,基因调控网络的重建与分析已经成为探索基因型与表型之间潜在机制的重要手段。本文旨在面向单细胞测序数据的基因调控网络构建方法研究,主要研究内容如下:

1)为了解决 scRNA-seq 数据的丢失以及高维度噪声问题,提出了一种名为SAE-ImputeSubspace Autoencoder-based Imputation)的创新插补方法,结合子空间回归模型和自编码器,以解决scRNA-seq数据丢失和高维噪声问题。SAE-Impute通过子空间回归评估样本相关性和预测丢失值,然后在自动编码器框架内进行去噪和缺失数据的插补。实验证明,SAE-Impute显著减少了单细胞数据的假阴性信号,增强了数据完整性和各种相关性。该方法在模拟和真实scRNA-seq数据集上展现出卓越表现,并通过下游分析包括识别差异基因表达、细胞聚类和可视化,以及构建细胞轨迹来验证其性能。

2)为了解决无监督或自监督模型不适用于从单细胞数据中推断基因之间的调控链路的挑战,提出了一种名为GRNNLinkGraph Recurrent Neural Networks Link)的创新基因调控链路预测模型方法,利用图神经网络技术从单细胞数据中推断基因调控链路。该模型通过引入图循环神经网络的交互式图编码器去细化基因特征以推断基因之间的潜在调控关系。实验结果显示,GRNNLink在七个scRNA-seq数据集上的表现优于六种现有的基因调控网络重建方法,表现出高稳健性和准确性。这一方法不仅提升了数据分析准确性,也为识别潜在调控因子提供了更全面的视角。

3)为了解决基因表达数据的高维性和非线性特征在大规模基因调控网络的准确推断与重建过程中带来的计算挑战,提出了一种新颖的多模型融合方法用于基因调控网络推断,名为MRF-XGBLCMulti-Model Fusion Inference with XGBoost, Random Forest, and Lasso-Cox)。通过采用多模型融合策略,利用不同模型的优势,提高了对基因表达数据高维特性和非线性特征的准确推断能力。MRF-XGBLC利用最大信息系数进行降维,并通过消除冗余调控关系的先决步骤来重建大规模基因调控网络(GRNs)。特征融合算法通过整合XGBoostRandom ForestLasso-Cox模型,能够有效地训练非线性常微分方程,提高了推理算法的准确性和稳定性。实验结果表明,MRF-XGBLC方法在不同规模的数据集上取得了显著改进,并在真实基因数据集上的交叉验证中验证了其稳健性和有效性。

4)为了解决基因调控网络(GRNs)难以捕捉时间调控动态变化,提出了一种名为DynamicTGRNDynamic Transcriptional Gene Regulatory Network)的方法,这是一个将动态图卷积网络 (DynamicGCN) 与基于 Transformer 的时间注意机制相结合的全新框架,用于预测转录因子-靶标随时间变化的相互作用。DynamicTGRN 通过编码基因-基因相互作用的动态 GCNs,优先考虑关键发育时间点的时间注意机制,以及端到端可训练的调控评分器等三个关键组件处理单细胞 RNA 序列时间序列数据,在数据预处理阶段也考虑到单细胞测序技术的噪声影响,在标准化的过程中引用了单细胞插补技术。在多个基因数据集上进行评估后,DynamicTGRN方法都具有良好的表现,并能识别差异表达分析遗漏的阶段特异性转录因子(TF)

 

 

 

 

 

 

 

 

主要学术成果

  1. Liang Bai, Boya Ji* and Shulin Wang*. SAE-Impute: imputation for single-cell data via subspace regression and auto-encoders[J]. BMC bioinformatics, 2024, 25(1): 317. (第一作者,JCR 1区,SCI)

  2. Liang Bai, Liwen Xu, Boya Ji, Shulin Wang* and Shaoliang Peng*. MRF-XGBLC: Large-scale gene regulatory network inference based on multi-model fusion[C]. 2024 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2024: 485-490. (第一作者,CCF B类会议)

  3. Liang Bai, Shulin Wang*. GRNNLink: Predicting gene regulatory links from single-cell RNA-seq data using graph recurrent neural network[C]. 2024 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2024: 491-496.(第一作者,CCF B类会议)

  4. Liang Bai, Shulin Wang*. DynamicTGRN: Temporal Gene Regulatory Network Prediction via Dynamic Graph Convolutional Networks and Transformer Attention[J]. Bioinformatics.(under review)

  5. Wang X, She X, Liang B, Qing Y, Jiang F. A novel anonymous authentication scheme based on edge computing in internet of vehicles[J]. Comput Mater Contin. 2021;67(3):3349-3361. (通讯作者,JCR 3区, SCI

  6. Shaoliang Peng*, Liang Bai, Li Xiong, Qiang Qu, Xiaolan Xie and Shulin Wang. GeoAI-based Epidemic Control with Geo-Social Data Sharing on Blockchain[C]. 2020 IEEE International Conference on E-health Networking, Application \& Services (HEALTHCOM). IEEE, 2021: 1-6. (第二作者,EI检索)

  7. 彭绍亮, 白亮, 王力, 程敏霞, 王树林. 面向智慧医疗的边缘计算体系的可信计算研究[J].电信科学.2020.(第二作者,CSSCI

  8. 王树林, 白亮.一种大规模基因调控网络推断方法及装置.(专利号 CN202410224200.9

  9. 彭绍亮, 刘加梦, 白亮, 刘浩, 肖霞, 张兴龙, 刘凡, 杨学超. 一种基于区块链的主节点公平选举方法。(专利授权 CN113114495B