答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈霞博士生答辩公告
浏览次数:日期:2022-06-13编辑:












学位论文简介

准确地识别肿瘤亚型并深入了解不同肿瘤亚型占主导的免疫逃逸通路是精准医疗的重要准备工作,然而肿瘤全基因组范围内位点、结构突变之间的上位性及肿瘤样本中的异质性使得肿瘤数据挖掘面临严峻挑战。传统关联研究结果存在假阳性、难以解释及遗传力缺失等不足,并且计算方法所识别的肿瘤亚型与临床组织分型差异较大。本文认为在充分挖掘全基因组单核苷酸多态性数据(SNP)之上,融合其它层次组学数据有助于系统、完整地理解肿瘤形成过程;构建生物分子相互作用网络并识别其关键子网特征,有利于提升肿瘤亚型分类或风险评估模型的性能;识别不同亚型间存在表达差异的重要基因,并理解其表达变异的调控机制,能为后续精准免疫治疗提供支撑。因此,本文研究包含如下四点工作:

1)提出了一种基于最大相关-最大一致性准则的上位性及异质性分析方法:首先,利用贝叶斯网络得分K2和信息熵等技术,设计了最大相关性-最大一致性准则,以综合、全面评估基因组SNP数据的上位性;随着SNP数量的增加,上位组合空间急剧增加,导致组合爆炸现象,因此,提出改进的遗传算法以启发式地搜索SNP上位性组合空间,以识别与不同亚型相关的多种潜在的易感上位性组合。注意到多种上位性组合分别对应于不同的致病基因组合,可能导致不同的肿瘤亚型,即异质性;最后,使用特征SNP训练XGBoost分类器,这些特征SNP包含了多组上位性组合中的易感位点,进而验证考虑肿瘤异质性是否有助于提高肿瘤亚型预测准确性的假设。为了证明该方法的有效性,对上位性识别的效能以及肿瘤亚型分类准确度加以评价。大量的仿真结果表明,该方法较以往研究方法更有效。

2)提出了一种基于凸包核的协同表示方法用以肿瘤亚型分类。基于高维小样本的微阵列数据的肿瘤诊断方法大多面临过拟合、假阴性率高等挑战。本文方法首先将待测试样本构建为仅包含有一个元素的特殊凸包,然后利用包含有不同类别样本的训练数据集协同地表示该凸包,并且采用核函数方法处理肿瘤样本高维、非线性可分等问题。本文在11个公开的肿瘤表达谱数据集上对不同肿瘤样本分类算法开展对比分析。实验结果表明,本文方法在准确度和计算效率等指标上,都具有一定的优势。

3)提出了一种用于揭示乳腺癌免疫逃逸调控机制的多源数据融合框架:基于免疫相关基因识别乳腺癌亚型,有助于了解不同亚型所主导的免疫逃逸通路,从而为不同亚型实施特异性的治疗措施。为此,本文首先利用非负矩阵分解和共识聚类算法分析了TCGARNA-seq乳腺癌数据,并根据先验的免疫相关基因识别了4种重要的亚型。然后,将TCGA中的乳腺癌样本与来自Genotype-Tissue ExpressionGTEx)数据库中非癌症个体正常组织开展基因表达差异分析,以识别与免疫亚型相关的重要免疫基因。接着,开展拷贝数变异(CNV)与免疫基因mRNA之间的相关性分析,并基于ATAC-seq数据研究了CNV无法解释的免疫基因的调控机制,实验结果发现,CDH1PVRL2在所有这四种亚型的逃避免疫通路中都扮演了重要的角色,并且 CDH1的表达变异主要由其自身的CNV导致,而PVRL2的表达变异更可能受转录因子调控。最后,对不同免疫亚型的类簇分别估计浸润的免疫细胞组成,并比较不同类簇之间免疫逃逸机制的差异。

4)提出了基于基因相互作用网络聚类和组稀疏学习的基因表达量性状-CNV关联分析方法:当前的基因表达差异解释方法面临几个主要挑战,如解释力低、预测准确性不足和缺乏生物学意义。本研究提出一种从基因组结构变异角度深入解释乳腺癌易感基因的mRNA表达差异原因的新计算方法。首先,收集了一些与乳腺癌相关的高风险基因,然后设计了一种基于排序的策略对乳腺癌样本基因组上CNVmRNA数据加以预处理。其次,为了丰富该方法的生物学意义并避免组合空间爆炸,引入了先验的基因相互作用网络,并应用网络聚类算法识别高密度子网络。最后,为了描述特征子网与目标基因的mRNA表达之间的相互联系,提出了组稀疏学习模型来解释CNVs与致病基因表达差异的关系。从实验结果来看,该方法不仅显著提升目标基因表达水平的预测准确性,并且通路富集分析结果进一步表明相关的CNV基因也与乳腺癌的发生、发展相关

主要学术成果

[1] Xia Chen, Yexiong Lin, Qiang Qu, Bin Ning, Haowen Chen*, Xiong Li. An epistasis and heterogeneity analysis method based on maximum correlation and maximum consistence criteria. Mathematical Biosciences and Engineering, 2021, 18(6): 7711-7726. doi: 10.3934/mbe.2021382 (第一作者,SCI

[2] Xia Chen, Yexiong Lin, Qiang Qu, Bin Ning, Haowen Chen* and Lijun Cai . A Multi-Source Data Fusion Framework for Revealing the Regulatory Mechanism of Breast Cancer Immune Evasion. Front. Genet., 12 November 2020 | https://doi.org/10.3389/fgene.2020.595324(第一作者,SCI

[3] Xia Chen, Yexiong Lin, Qiang Qu, Bin Ning, Haowen Chen, Bo Liao and Xiong Li. Analyzing Association between Expression Quantitative Trait and CNV for Breast Cancer Based on Gene Interaction Network Clustering and Group Sparse Learning. Current Bioinformatics. DOI: 10.2174/1574893617666220207095117

[4] Xia Chen, Haowen Chen*, Dan Cao, Bo Li. Kernelized Convex Hull based Collaborative Representation for Tumor Classification,Current Proteomics, 15(5), pp 384-393, 2018-10-15(第一作者, SCI