答辩公告
我的位置在: 首页 > 答辩公告 > 正文
林圣乐博士生答辩公告
浏览次数:日期:2024-11-25编辑:

学位论文简介

基础线性代数数学库是科学计算与人工智能领域最为基础的数学软件工具,几乎所有涉及到数值运算的问题都依赖于向量和矩阵的基本计算形式。本论文面向诸多国产异构计算设备,针对高性能 BLASBasic Linear Algebra Subprograms)和 LAPACKLinear Algebra Package)基础线性代数库中的四大关键算子的优化技术开展了研究,论文的主要创新点如下:

1)提出了一种面向异构系统基于 OpenCL 框架实现的 GEMM 优化算子。论文提出了针对本地内存和寄存器文件的双缓冲流水线技术,并针对国产 GPU 计算核上宝贵的寄存器空间设计了细粒度预取优化策略。此外,设计了一个基于贝叶斯优化的算子自适应调优器,使该 BLAS 算子库具备性能可移植性。

2)提出了一种面向多核 CPU 架构的性能可移植的 SpMV 智能计算框架 SSpMV。论文设计了多模态卷积神经网络模型 MM-Adapter 来捕捉隐式稀疏计算结构,使得 SSpMV 具有输入感知性,可以自适应地确定给定稀疏矩阵的最佳存储格式和配置参数。

3)提出了一种面向多 NUMA 架构的层次并行优化的稀疏超节点 Cholesky 分解算法 HPS-Cholesky。论文构造了细粒度松弛合并因子 TRelax,并利用图神经网络模型,自适应控制超节点的合并粒度。其次,针对数值分解过程提出了层次并行优化策略,并结合流式任务映射优化,在国产多核系统上实现负载均衡。

4)提出了一种面向多 NUMA 架构的流式任务映射优化的稀疏多波前 QR 分解算法 STM-MQR。论文针对符号分析中的重排序过程,设计了一个图卷积神经网络用于自适应地推理最优重排序策略。而在数值分解阶段,提出了线程 NUMA 绑定策略和数据 NUMA 亲和策略以改善稀疏 QR 分解过程中的线程跨域访存问题,显著提升了算子并行性能

主要学术成果

[1] Shengle Lin, Wangdong Yang, Haotian Wang, Qinyun Tsai, Kenli Li. STM-multifrontal QR: streaming task mapping multifrontal QR factorization empowered by GCN[C]// SC' 21: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. 2021: 1-14.CCF-A类会议,第一作者)

[2] Shengle Lin, Wangdong Yang, Yikun Hu, Qinyun Cai, Minlu Dai, Haotian Wang, Kenli Li. HPS Cholesky: Hierarchical parallelized supernodal Cholesky with adaptive parameters[J]. ACM Transactions on Parallel Computing, 2024, 11(1): 1-22.ACM Trans源刊,第一作者)

[3] Shengle Lin, Guoqing Xiao, Haotian Wang, Wangdong Yang, Kenli Li, Keqin Li. High Performance OpenCL-based GEMM Kernel Auto-tuned by Bayesian Optimization[J]. IEEE Transactions on Parallel and Distributed Systems. 2024. (CCF-A类期刊,第一作者,大修)

[4] Qinyun Cai, Guoqing Xiao, Shengle Lin, Wangdong Yang, Keqin Li, Kenli Li. ABSS: An Adaptive Batch-Stream Scheduling Module for Dynamic Task Parallelism on Chiplet-based Multi-Chip Systems[J]. ACM Transactions on Parallel Computing, 2024, 11(1): 1-24.ACM Trans源刊,第三作者)

[5] 阳王东,王昊天,张宇峰,林圣乐,蔡沁耘. 异构混合并行计算综述[J]. 计算机科学, 2021, 48(12): 24-28.CSCD中文核心收录,CCF B类中文期刊,第四作者)