答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈建国答辩公告
浏览次数:日期:2018-05-30编辑:研究生教务办1

答辩公告

论文题目

分布式并行机器学习算法及其生物医学应用

答辩人

陈建国

指导教师

李克勤

答辩委员会

主席

骆嘉伟

学科专业

计算机科学与技术

学院

信息科学与工程学院

答辩地点

软件楼105

答辩时间

201864

下午300


学位论文简介

在大数据时代,如何高效准确地从大规模数据集中获取有价值的知识已引起学术界和工业界的日益关注。本文围绕分布式并行机器学习算法研究工作展开,具体包括并行分类算法、聚类算法、图挖掘算法和深度学习算法。并将所提出算法应用在生物医学领域,为医学诊断提供科学依据并探索生命现象和生物活动规律。本文的主要工作和创新点如下:

(1) 研究了分布式并行分类算法及其在医院智能导诊领域的应用。基于Apache Spark云计算平台,提出一种并行随机森林(PRF)分类算法。分别从数据并行和任务并行两个角度对PRF算法进行分布式并行设计。在此基础上,将所提出的PRF算法应用于医院智能导诊系统,对历史患者就诊耗时模型进行训练,并根据医院各个就诊项目的当前候诊排队情况,为当前患者进行就诊路径规划和推荐,达到智能导诊的目的。

(2) 研究了分布式并行聚类算法及其在疾病诊疗方案推荐领域的应用。提出一种自适应域密度峰值聚类(ADDC)算法。针对变化密度分布(VDD)数据集的稀疏簇丢失问题,提出一种自适应域密度测量方法。针对多域密度峰值(MDDM)数据集上的簇碎片化问题,提出一种簇自合并方法。将所提出的ADDC算法应用于疾病诊疗推荐系统,系统根据每个患者的检验报告自动匹配疾病症状簇并推荐相应的治疗方案。

(3) 研究了基于分布式计算的大规模并行深度学习算法及其在结肠癌细胞核检测和分类应用。提出一种基于分布式计算的卷积神经网络双层并行训练(BPT-CNN)架构,有效提高CNN算法的训练性能。分别提出数据并行、权重异步更新和动态数据迁移等策略,以解决分布式并行计算的数据通信、任务同步和工作负载均衡等问题。提出一种基于BPT-CNN的结肠癌细胞核检测和分类算法,对病理切片图像中不同形态的癌细胞核进行有效检测和分类。

(4) 研究了大规模并行图挖掘算法及其在蛋白质相互作用(PPI)网络的应用。提出了一种基于多源学习的蛋白质群落检测(MLPCD)算法,以凝聚方式检测WPPI网络中的蛋白质群落。并将检测到的蛋白质群落与已知的蛋白质复合物和功能模块进行比较,并使用基因本体注释来评估蛋白质功能模块的功能富集程度。实验结果表明了MLPCD算法在精度和性能方面优于相关算法。


主要学术成果

[1] Jianguo Chen, Kenli Li, Kashif Bilal, and Keqin Li. A Disease Diagnosis and Treatment Recommendation System Based on Big Data Mining and Cloud Computing [J]. Information Sciences, 2018, 435: 124-149. (SCI 2, CCF B类 第一作者)

[2] Jianguo Chen, Kenli Li, Zhuo Tang, Kashif Bilal, Shui Yu, Chuliang Weng, and Keqin Li. A Parallel Random Forest Algorithm for Big Data in a Spark Cloud Computing Environment [J]. IEEE Transactions on Parallel and Distributed Systems, 2017, 28(4): 919-933. (SCI 2, CCF A, 第一作者)

[3] Jianguo Chen, Kenli Li, Zhuo Tang, Kashif Bilal, and Keqin Li. A Parallel Patient Treatment Time Prediction Algorithm and Its Applications in Hospital Queuing-Recommendation in a Big Data Environment [J]. IEEE ACCESS. 2016,4: 1767-1783. (SCI 3, 第一作者)

[4] Jianguo Chen, Zhuo Tang, Kenli Li, and Keqin Li. Parallel Data Mining and Applications in Hospital Big Data Processing [M]. Big Data Management and Processing, 2017. May. 25 403-424 (专著书稿, 第一作者).


上一篇:
徐实答辩公告
下一篇:
THABO EMONG答辩公告