
学位论文简介
近年来,随着下一代测序技术和空间组学技术的快速发展,生命科学研究正逐步转向对细胞分子差异及空间组织规律的精细分析。细胞异质性不仅体现在基因表达、功能状态和发育阶段等分子与功能层面的差异,还体现在空间分布、邻域组织方式及微环境相互作用等空间层面的差异。对细胞异质性的系统研究,有助于揭示组织发育、细胞状态转变及疾病演进规律。单细胞转录组技术和空间转录组技术的发展,为细胞异质性的多层次分析提供了重要数据基础,并推动相关研究由表达层面的分析逐步拓展到空间结构与组织关系的解析。基于此,本文面向单细胞转录组和空间转录组数据的细胞异质性分析问题,构建了由真实表达恢复到空间结构识别、由局部结构信息表征到空间结构与微环境关系解析的递进式研究框架。主要创新成果如下:
(1)针对单细胞RNA测序数据稀疏性高,以及现有填充方法难以同时兼顾表达恢复与细胞间差异保留的问题,提出了基于生成对抗网络和对比学习的单细胞转录组填充模型scGANCL。模型以双向生成对抗网络为核心框架,联合建模数据生成过程与潜在表示学习,以提高真实基因表达模式的恢复能力。此外,设计对比学习模块,通过约束真实样本与生成样本在表示空间中的一致性,提高对细胞间差异信息的保持能力。实验结果表明,scGANCL在聚类、稀有细胞识别、细胞发育轨迹推断及差异表达基因分析等任务中均表现出较好性能,为单细胞转录组数据的表达填充及后续异质性分析提供了有效方法。
(2)针对空间转录组分析中基因表达信息与组织学图像难以有效对齐和协同挖掘的问题,提出了基于跨模态对比学习的空间转录组结构识别模型SIMMT。该模型采用双分支Transformer结构,分别编码基因表达信息和组织学图像信息,实现两类特征的联合建模。为增强不同模态表示的一致性,进一步设计跨模态对比学习模块,通过细胞内模态一致性约束和空间邻域关联建模,促进不同模态特征在表示空间中的有效对齐,从而提升模型对空间组织结构的表征能力。实验结果表明,SIMMT在不同组织类型、技术平台和分辨率的数据上均能有效识别空间组织区域及其结构模式,并表现出较好的稳定性和跨平台泛化能力。
(3)针对现有空间转录组结构识别方法难以充分利用细粒度表达差异的问题,提出了基于高频感知的双视图空间转录组结构识别模型HiFi-ST。该模型构建空间图与特征图协同建模的双视图学习框架,在空间图上利用Transformer学习细胞间空间邻域关系,在特征图上通过高通滤波器提取基因表达信号中的高频差异信息,从而增强对局部表达变化的建模能力。为促进两类信息的协同融合,模型进一步引入对比学习约束不同视图表示的一致性,提升细胞表示的稳定性和判别能力。实验结果表明,HiFi-ST在空间结构识别、基因表达增强和空间niche识别等任务中均优于基线方法,验证了其在高分辨率空间转录组数据分析中的有效性。
(4)针对现有空间结构解析方法通常采用固定空间邻域进行信息整合,难以适应不同区域结构差异的问题,提出了基于尺度自适应图学习的空间转录组结构解析模型HAST。该模型通过度量空间图中的结构异质性,自适应调节图滤波尺度,使邻域信息利用范围能够随区域结构差异动态变化。同时,模型基于频率分解提取反映整体空间结构的低频特征和保留局部变化的高频残差特征,并通过特征融合与Transformer编码学习兼顾整体连续性和局部变化的空间表示。实验结果表明,HAST在空间结构识别任务中显著优于多种现有方法,并在跨切片实验中表现出较好的泛化能力。进一步结合肿瘤富集簇识别与空间邻域富集分析,HAST能够解析肿瘤相关区域及其邻域组织模式。
主要学术成果
[1]Wanwan Shi, Ying Liu, Qiu Xiao, Yuting Bai, Xiao Liang, Xinling Zeng, Chee Keong Kwoh*, Jiawei Luo*. Image-enhanced Multi-Modal Contrastive Transformer for subcellular spatial transcriptomics[J]. IEEE Journal of Biomedical and Health Informatics, 2025. doi:10.1109/JBHI.2025.3630325 . (SCI 2 区TOP期刊,第一作者)
[2]Wanwan Shi, Bo Wang, Yahui Long, Ying Liu, Qiu Xiao,Yuting Bai, Xiaoyi Peng, Xiangtao Chen*, Jiawei Luo*. High-Frequency-Aware Graph Integration for Subcellular Spatial Transcriptomics[C]. 2025 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE, 2025: 550-555. (CCF B 类会议,第一作者)
[3]Wanwan Shi, Yahui Long, Jiawei Luo*, Ying Liu*, Zehao Xiong, Bo Wang, Zhongyuan Xu. scGANCL: Bidirectional Generative Adversarial Network for Imputing scRNA-Seq Data With Contrastive Learning [J]. IEEE Transactions on Computational Biology and Bioinformatics, 2025, 22(2): 661-671. (CCF B 类期刊,第一作者)
[4]Zehao Xiong, Jiawei Luo*, Wanwan Shi, Ying Liu, Zhongyuan Xu, Bo Wang. scGCL:an imputation method for scRNA-seq data based on graph contrastive learning[J].Bioinformatics, 2023, 39(3): btad098. (CCF B 类期刊)
[5]Yuting Bai, Hanwen Lv, Wanwan Shi, Zhiyi Zou, Jiawei Luo*.Multi-Level Domain Adaptation and Contrastive Domain Isolation with Bilinear Fusion for Patient Drug Response Prediction. AAAI, 2026. (CCF A 类会议)
[6]Zhiyi Zou, Yuting Bai, Bo Wang, Wanwan Shi, Xiao Liang, and Jiawei Luo*. HIDF: Integrating Tree-Structured scRNA-seq Heterogeneity for Hierarchical Deconvolution of Spatial Transcriptomics[J]. Advanced Science, 2026, 13(12): e14073. (SCI 1区)
[7]Bo Wang, Jiawei Luo*, Ying Liu, Wanwan Shi, Zehao Xiong, Cong Shen and Yahui Long. Spatial-MGCN: a novel multi-view graph convolutional network for identifying spatial domains with attention mechanism [J]. Briefings in Bioinformatics, 2023,24(5): bbad262. (CCF B 类期刊)
[8]Qiu Xiao*, Yan Zhang, Wanwan Shi, Li Wang, Ying Zuo, Fei Guo,Jiawei Luo. scMID:a Deep Multi-omics Integration Framework for Comprehensive Single-cell Data Analysis. IEEE Transactions on Computational Biology and Bioinformatics, 2025. (CCF B 类期刊)