答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈岑答辩公告
浏览次数:日期:2019-03-01编辑:研究生教务办1

答辩公告

论文题目

面向大数据的异构并行处理技术研究

答辩人

陈岑

指导教师

李肯立 教授

答辩委员会

主席

骆嘉伟 教授

学科专业

计算机科学与技术

学院

信息科学与工程学院

答辩地点

信科院105

答辩时间

20193 月3 日

时间 上午9:30


学位论文简介

      本文的主要研究工作分为以下四个方面。在这四个方面的研究工作中,深入研究了一系列提升基于异构并行计算资源的内存计算性能、可用性和可编程性的手段,同时也深入研究了基于内存计算平台和内存异构计算平台的,设计和提升并行机器学习算法性能的技术和方案,如近似算法、合理的数据划分和中间结果缓存等。

1. 提出了一个融合CUDA和Flink平台的大数据异构并行计算框架GFlink。

我们提出的架构使原始的Flink平台从CPU集群扩展到了异构CPU/GPU集群,大大提高了Flink的计算能力。此外,我们充分考虑平台的可编程性和易用性,采用了一系列手段来提升系统的性能,如高效的JVM-GPU通信策略、 三阶段流水线执行的策略、 GPU缓存方案和自适应局部感知调度方案。

2. 提出了一个融合OpenCL和Flink平台的大数据异构并行计算框架FlinkCL。

为了进一步提升系统的可编程性和易用性,我们提出了FlinkCL, 一个基于OpenCL的异构CPU/GPU集群的内存计算架构。易用性和可编程性是FlinkCL的创新点,程序员只需要用简单的接口编写Java代码。Java代码可以编译为OpenCL内核,并自动在CPU和GPU上执行。

3. 提出了一个基于MapReduce模型的并行近似半监督极限学习机算法。

我们首先提出了一种基于MapReduce模型的高效并行SS-ELM(Parallel SS-ELM, PSS-ELM)算法,并采用了一系列优化手段以提升其性能。其中一个创新点是提出了一种并行近似SS-ELM(Parallel Approximate SS-ELM, PASS-ELM)算法。PASSELM基于近似的相邻相似性矩阵算法,利用局部敏感哈希(Locality Sensitive Hashing, LSH)算法来计算近似相邻相似矩阵,从而大大降低了复杂性和所占用的内存。

4. 基于GFlink平台提出了一个并行层次化ELM算法。

层次化极限学习机(Hierarchical Extreme Learning Machine ELM, H-ELM)算法把ELM 从单层隐藏层前馈网络到多隐藏层前馈网络,大大增强了ELM的适用性。通常为了训练层次较深的多隐藏层前馈网络,需要比较大的训练集。我们提出了一种基于Flink和GPU的并行层次化极限学习机算法(GPH-ELM)。采用了几种优化方法来提升其性能,如基于缓存的方案和合理的数据划分策略等。

通过对上述面异构计算环境下大数据计算系统体系结构研究,高效的大数据机器学习算法设计,以及异构计算环境下面向大规模数据集的并行机器学习算法方面的研究,本文取得了一系列研究成果。

主要学术成果:
[1]
Cen Chen,Kenli Li,Aijia Ouyang.FlinkCL: An OpenCL-based In-Memory Computing Architecture on Heterogeneous CPU-GPU Clusters for Big Data.IEEE Transactions on Computers.2018年,67卷(12期):1765-1779页
[2]
Cen Chen,Kenli Li,Aijia Ouyang.GPU-Accelerated Parallel Hierarchical Extreme Learning Machine on Flink for Big Data.IEEE Transactions on Systems Man & Cybernetics Systems: Systems.2017年,47卷(10期):2740-2753页
[3]
Cen Chen,Kenli Li,Aijia Ouyang.A Parallel Approximate SS-ELM Algorithm based on MapReduce for Large-Scale Datasets.Journal of Parallel and Distributed Computing.2017年,108卷:85-94页
[4]
Cen Chen,Kenli Li,Sin G. Teo.Exploiting Spatio-Temporal Correlations with Multiple 3D Convolutional Neural Networks for Citywide Vehicle Flow Prediction.IEEE International Conference on Data Mining.2018年:893-898页
[5]
Cen Chen,Kenli Li,Aijia Ouyang.GFlink: An in-memory computing architecture on heterogeneous CPU-GPU clusters for big data.IEEE Transactions on Parallel and Distributed Systems.2018年,29卷(6期):1275-1288页
[6]
Cen Chen,Kenli Li,Aijia Ouyang.GFlink An in-memory computing architecture on heterogeneous CPU-GPU clusters for big data.45th International Conference on Parallel Processing.2016年:542-551页
[7]
Cen Chen,Kenli Li,Sin G. Teo.Gated Residual Recurrent Graph Neural Networks for Traffic Prediction.33th AAAI Conference on Artificial Intelligence. 已接收,2019年



上一篇:
吴志强答辩公告
下一篇:
张维预答辩公告