答辩公告
我的位置在: 首页 > 答辩公告 > 正文
邹远强答辩公告
浏览次数:日期:2019-03-14编辑:研究生教务办1

答辩公告

论文题目

基于基因序列和互联网数据的流感病毒变异与流行预测研究

答辩人

邹远强

指导教师

蒋太交

答辩委员会

主席

骆嘉伟

学科专业

计算机科学与技术

学院

信息科学与工程学院

答辩地点

信科院

105会议室

答辩时间

2019323

上午1000

学位论文简介

传染病的预防和控制是全球关注的重要公共卫生问题。进入21世纪以来,新发突发传染病暴发频繁,以及登革热、基孔肯雅和疟疾等传染病的再度出现和流行,给世界各国和地区造成了极大的健康威胁和危害随着信息化和全球化的快速发展,整合病原基因组和互联网大数据,能扩展传染病监测范围提前预测传染病的暴发推荐合适的疫苗,是对传统传染病监测手段的有效补充。本研究对基于基因序列和互联网数据的流感病毒变异与流行预测相关技术进行深入研究。主要创新性研究成果如下:

(1) 基于基因序列的高致病性禽流感H5N1病毒抗原变异预测技术流感病毒的高突变率使得它能够快速的改变抗原,从而使得老的流感疫苗失去作用,严重影响疫苗对人群的保护效果。因此流感疫苗的更新,非常需要快速准确地预测病毒变异。为此,本文首先引入人流感H3N2已知的五个抗原表位,提出推断高致病性禽流感H5N1抗原表位的新方法;随后,通过引入推断得到的H5抗原表位以及HI实验结果,使用朴素贝叶斯模型,发展了一个快速预测高致病性禽流感H5N1抗原变异预测模型,并基于该预测模型研发了PREDAC-H5服务器。模型对H5N1病毒的疫苗推荐有重要指导意义。

(2) 基于基因序列的共进化网络模型以及其在流感病毒变异研究中的应用基因组共进化模型能方便我们从共进化的角度推导病毒结构和功能的关联。因此对共进化网络模型优化以及对位点共进化度量方法的研究能方便科研工作者使用共进化方法分析从物种水平到蛋白水平到残基水平的规律,探索两个蛋白或残基协同变化机理。该模型用于物种或蛋白之间的相互作用,有关联蛋白构成的通路,关联蛋白的相似功能等研究领域。本研究首先在实验室已有工作基础上使用R语言实现并优化了共进化网络模型,以工具包“cooccurNet”的形式发布在R语言公共资源库CRAN上。该工具包支持对核苷酸、氨基酸以及SNP等序列的共进化网络构建与分析,并通过支持R语言以及CUDA并行框架加速该模型的计算;接着,为了更好地评估位点共进化的程度,提出了一种新的共进化网络度量方法(RCOS),该方法在识别氨基酸位点间结构约束方面与当前最主流方法的效果相当,但更为简单,并且支持统计学显著性度量;最后,本文基于该工具,从流感病毒表面蛋白HANA共进化的角度,探索了不同种流感病毒亚型在适应性上存在差异的分子机制。

(3) 基于互联网数据的流感流行预测技术。流感样病例的采集作为流感监测网络预测流感流行工作的起点,导致流感流行预测滞后,不能真实反映流感流行情况,因此,预测流感的流行需要考虑更多的外部数据。互联网上的用户行为数据已被证明与传染病的活动存在很高的关联性。互联网数据规模庞大、复杂多样、存在大量噪声、汉语言存在很强的歧义性。而且,中国环境复杂,传染病存在较强的地域特异性。鉴于此,需要设计适合中国国情的基于互联网数据的流感流行预测方法。由此,本文研究了传染病本体知识库的建设,并尝试使用众包技术评估本体知识库的质量,定义了基于本体知识库选择流感监测关键词的策略,并基于此策略,以好搜搜索指数、百度指数及新浪微博指数为监测数据源,建立了流感流行预测模型,并比较了按全国及部分省份所建模型的性能以及不同数据源对模型的贡献。该研究显示了基于互联网数据预测流感流行的方法可以弥补现有监测网络在监测范围和及时性等方面的不足,可以作为现有流感监测网络的有效补充和延伸。

最后,通过跟国家流感中心的合作,提出以流感监测网络为基础的,基于基因序列和互联网数据的流感防控新策略:首先通过对互联网数据的挖掘分析使得我们可以密切监测任何可疑传染病在全国范围内的活动。一旦出现异常活动,中国疾控中心应立即作出反应,并通过传统监测网络收集样本,报告疑似病例,并进一步做基因测序。在强大的计算模型的帮助下,整合基因序列、互联网数据以及现有监测网络数据将改变流感防控的模式。

主要学术成果

[1] Zou Y, Wu Z, Deng L, et al. cooccurNet: an R package for co-occurrence network construction and analysis. Bioinformatics, 2017, 33(12): 1881-1882. SCI源刊二区,IF= 5.481.

[2] Zou Y, Peng Y, Deng L, et al. Monitoring infectious diseases in the big data era. Science Bulletin, 2015, 60(1): 144. SCI源刊三区,IF= 4.136.

[3] Peng Y, Zou Y, Li H, et al. Inferring the antigenic epitopes for highly pathogenic avian influenza H5N1 viruses. Vaccine, 2014, 32(6): 671-676. SCI源刊三区,共同第一作者,IF= 3.285.

[4] Zou Y, Peng Y, Lu L, et al. Prediction of influenza epidemics at the province level in China using search query from “Haosou”[C]// International Conference on Fuzzy Systems and Knowledge Discovery. IEEE, 2015:1450-1454..

[5] Zou Y, Li K, Jiang T, et al. Prediction of Cell Specific O-GalNAc Glycosylation in Human[M]// Data Science. 2017:286-292


上一篇:
霍晟答辩公告
下一篇:
吴志强答辩公告