答辩公告
我的位置在: 首页 > 答辩公告 > 正文
王昊天博士生答辩公告
浏览次数:日期:2023-11-24编辑:

学位论文简介

稀疏张量由于能够更加紧凑地表示数据,同时保留了重要的信息,因此受到了广泛的关注。然而,高维且稀疏的特性对计算和存储造成了巨大挑战,传统的数据处理方法无法有效处理稀疏张量数据。因此,提高计算性能、优化存储效率,同时保持结果的准确性,是当前稀疏张量运算性能优化研究的核心目标之一。随着处理器架构的从单一架构到异构架构的演进,计算能力的提升与优化方法的选择变得更为复杂。异构计算架构为稀疏张量运算的并行算法设计和性能优化带来了新的机遇和挑战。不同类型的硬件核心适用于不同的稀疏张量运算任务,但也需要解决硬件差异、数据传输开销等问题。因此,如何在异构架构的背景下充分发挥其优势,实现高效的并行计算和内存管理,仍然是一个亟待解决的问题。本文主要围绕CPU-GPU异构平台上稀疏张量运算的并行算法设计和性能优化展开研究工作,其中包括具有内存限制特征的稀疏张量乘以向量(SpTV)、具有批计算特征的稀疏张量乘以矩阵(SpTTM)、具有高维计算特征的稀疏张量缩并(SpTC)以及具有链乘计算特征的稀疏张量矩阵链乘(SpTMCM)。本文主要工作内容和创新点如下:

针对SpTV的计算效率问题,本文的第一个研究设计了一种名为IAP-SpTV的创新性方法。该方法通过融合混合张量格式和流水线技术,动态选择最佳的存储格式和流水线数量,显著提升稀疏张量与向量的乘法运算效率。IAP-SpTV的独特之处在于其适应性,不仅适用于各类数据类型和硬件环境,还能够巧妙地最大程度地重叠计算和数据传输,从而极大增强了计算性能和效率。

针对SpTTM的计算过程,本文的第二个研究专注于CPU-GPU异构平台,为SpTTM精心设计了一系列专门的异构并行算法,以适应不同硬件架构的独特特性。通过精心规划的任务映射策略、稀疏格式选择模型和内存访问模式的优化,实现了稀疏张量乘以矩阵运算的高效并行计算。这项创新性的设计不仅显著提高了计算速度,同时也优化了计算资源的高效利用。

针对SpTC的高维特性,本文的第三个研究采用了位压缩和位图技术,以降低高维张量的存储开销,从而显著提高内存访问效率。此外,引入了冲突解决方法,通过构建任务列表和消除任务之间的依赖关系,有效提高了线程块的利用率。通过精心设计高效的TCU填充策略,确保在处理各类张量缩并任务时,TCU得到最大程度的利用。这些策略不仅在充分发挥了新一代GPU性能优势的同时,也显著加速了高维稀疏数据的并行计算。

针对SpTMCM的高效处理问题,本文的第四个研究引入了一项创新性的统一计算方式,将计算粒度从非零元素粗化到切片粒度,以适应TCU的矩形计算方式。通过采用多维平铺的混合张量格式和高效的内存访问模式,进一步实现SpTMCM的高效并行算法。这一方法极具灵活性,能够充分利用GPU上不同计算核心的优势,从而实现对连续张量乘法运算的高速加速。

主要学术成果

  1. Haotian Wang, Wangdong Yang, Rong Hu, Renqiu Ouyang, Kenli Li, Keqin Li. A Novel Parallel Algorithm for Sparse Tensor Matrix Chain Multiplication via TCU-acceleration[J]. IEEE Transactions on Parallel and Distributed Systems, 2023, 34(8): 2419-2432. (第一作者,JCR 1区,SCI 2区,CCF A类期刊,IF5.3)

  2. Haotian Wang, Wangdong Yang, Rong Hu, Renqiu Ouyang, Kenli Li, Keqin Li. IAP-SpTV: An Input-aware Adaptive Pipeline SpTV via GCN on CPU-GPU[J]. Journal of Parallel and Distributed Computing, 2023, 181C:104741. (第一作者,JCR 1区,SCI 2区,CCF B类期刊,IF3.8)

  3. Haotian Wang, Wangdong Yang, Renqiu Ouyang, Rong Hu, Kenli Li, Keqin Li. A Heterogeneous Parallel Computing Approach Optimizing SpTTM on CPU-GPU via GCN[J]. ACM Transactions on Parallel Computing, 2023, 10(2): 1-23. (第一作者,IF1.6)

  4. Haotian Wang, Huigui Rong, Qun Zhang, Daibo Liu, Chunhua Hu, Yupeng Hu. Good or Mediocre? A Deep Reinforcement Learning Approach for Taxi Revenue Efficiency Optimization[J]. IEEE Transactions on Network Science and Engineering, 2020, 7(4): 3018-3027. (第一作者,JCR 1区,SCI 3区,IF6.6)

  5. 阳王东, 王昊天, 张宇峰, 林圣乐, 蔡沁耘. 异构混合并行计算综述[J]. 计算机科学, 2021, 48(12): 24-28.(第二作者,CSCD收录,CCF B类中文期刊)