答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈霞博士生预答辩公告
浏览次数:日期:2021-10-13编辑:研究生秘书

学位论文简介

针对肿瘤的不同亚型,实施有特异性、精准的临床治疗手段能有效提升临床预后质量。准确地识别肿瘤亚型并深入了解不同肿瘤亚型占主导的免疫逃逸机制是精准医疗的重要准备工作,然而肿瘤全基因组上基因、结构突变之间的上位性及肿瘤样本中的异质性使得肿瘤数据挖掘面临严峻挑战。传统研究策略主要存在关联研究结果难以复现,可解释性差及遗传力缺失等不足。本文认为在深入开展全基因组 SNP 数据深度挖掘的基础上,融合其它层次组学数据有助于系统、完整地理解肿瘤形成过程;构建生物分子相互作用网络并识别其关键子网特征,有利于提升肿瘤亚型分类或风险评估模型性能;识别不同亚型间存在表达差异的重要基因,并理解其表达变异的调控机制,能为后续精准免疫治疗提供支撑。因此,本文研究包含了如下四项研究内容:

1提出一种基于最大相关-最大一致性准则的上位性及异质性分析方法:首先,面向基因组单核苷酸多态性(SNP)数据、利用贝叶斯网络得分K2和信息熵等原理,设计了最大相关性-最大一致性准则,以综合、全面评估基因组上位性;随着SNP数量的增加,上位组合空间急剧增加,导致组合爆炸现象。因此,提出改进遗传算法启发式地搜索SNP上位组合空间,以确定多种潜在的易感上位性组合。值得注意的是,多种上位性组合分别对应于不同的致病基因组合,可能导致不同的肿瘤亚型,即异质性;最后,XGBoost分类器使用特征SNP进行训练,这些特征SNP包含了多组上位性组合中的易感位点,进而验证考虑肿瘤异质性有助于提高肿瘤亚型预测准确性的假设。为了证明该方法的有效性,通过上位性识别的效能以及肿瘤亚型分类准确度加以评价。大量的仿真结果表明,该方法较以往研究方法更有效且具有更好的预测准确度。

2提出一种基于核化凸包的协同表示方法用以肿瘤诊断。基于高维小样本的微阵列数据的肿瘤早期诊断方法大多面临过拟合、假阴性率高等挑战。本文方法首先将待测试样本构建为仅包含有一个元素的特殊凸包,然后利用包含有不同类别样本的训练数据集协同地表示该凸包。并且,采用核函数方法处理肿瘤样本高维、非线性可分等问题。目前,用以微阵列数据分析的分类算法较多,它们具有不同的特点。本文在11个公开的肿瘤表达谱数据集上对11种不同肿瘤样本分类算法开展了比较分析。实验结果表明,本文方法在准确度和计算效率等指标上,都具有一定的优势。

3提出一种用于揭示乳腺癌免疫逃逸调控机制的多源数据融合框架:基于免疫相关基因识别乳腺癌亚型,有助于了解不同亚型所主导的免疫逃逸途径,从而为不同亚型实施有效的治疗措施。为此,本文在The Cancer Genome Atlas TCGARNA-seq乳腺癌数据上使用了非负矩阵分解和一致的聚类算法,并根据先验的免疫相关基因识别了4种重要的亚型。然后,将TCGA中的乳腺癌样本与来自Genotype-Tissue ExpressionGTEx)数据库中非癌症个体正常组织开展基因表差异表达分析,以识别与免疫亚型相关的重要免疫基因。接着,进行拷贝数变异(CNV)与免疫基因mRNA之间的相关性分析,并基于ATAC-seq数据研究了CNV无法解释的免疫基因的调控机制,实验结果发现,CDH1PVRL2在所有这四种亚型的逃避免疫通路中都扮演了重要的角色,并且 CDH1的表达变异主要由其自身的CNV导致,而PVRL2的表达变异更可能受转录因子调控。最后,对不同免疫亚型的类簇分别估计浸润的免疫细胞组成,并比较不同类簇之间免疫逃逸机制的差异。

4提出基于基因相互作用网络聚类和组稀疏学习的基因表达量性状-CNV关联分析方法:当前的基因表达变异解释方法面临几个主要挑战如解释力低、预测准确性不足和缺乏生物学意义。本研究提出了一种新的计算方法从基因组结构变异角度深入解释乳腺癌易感基因的mRNA表达差异的原因。首先,收集了一些与乳腺癌相关的高风险基因,然后设计了一种基于排序的策略对乳腺癌的拷贝数变异(CNV)和mRNA数据加以预处理。其次,为了丰富该方法的生物学意义并避免组合空间爆炸,我们引入了先验的基因相互作用网络,并应用网络聚类算法识别高密度子网络。最后,为了描述特征子网与目标基因的mRNA表达之间的相互联系,提出了组稀疏学习模型来解释CNVs与致病基因表达差异的关系。从实验结果来看,该方法不仅显著提升了的目标基因表达预测的准确性,并且通路富集分析结果进一步展示了相关的CNV基因也与乳腺癌的发生、发展相关。

主要学术成果

  1. Xia Chen, Yexiong Lin, Qiang Qu, Bin Ning, Haowen Chen*, Xiong Li. An epistasis and heterogeneity analysis method based on maximum correlation and maximum consistence criteria[J]. Mathematical Biosciences and Engineering, 2021, 18(6): 7711-7726. doi: 10.3934/mbe.2021382

  2. Xia Chen, Yexiong Lin, Qiang Qu, Bin Ning, Haowen Chen* and Lijun Cai . A Multi-Source Data Fusion Framework for Revealing the Regulatory Mechanism of Breast Cancer Immune Evasion. Front. Genet., 12 November 2020 | https://doi.org/10.3389/fgene.2020.595324

  3. Xia Chen; *Haowen Chen; Dan Cao; Bo LiKernelized Convex Hull based Collaborative Representation for Tumor ClassificationCurrent Proteomics, 15(5), pp 384-393, 2018-10-15