答辩公告
我的位置在: 首页 > 答辩公告 > 正文
何贤浩博士生预答辩公告
浏览次数:日期:2026-03-19编辑:

学位论文简介

图神经网络推理的高效执行是高性能计算与人工智能交叉领域的重要研究课题。随着现实世界中图数据规模的不断扩大以及异构计算平台的普及,从算子层、计算图层到模型层进行系统性的多层级协同优化已成为加速图神经网络推理的主流趋势。然而,图数据的拓扑不规则性、算子计算模式的多样性以及硬件体系结构的异构性,使得多层级协同优化面临三大挑战:不规则稀疏模式难以适配多样化的硬件架构特征;图算子与神经网络算子难以映射最优的内核融合策略;异构计算资源与多任务动态负载难以协同调度。解决上述三大挑战,全面提升图神经网络在异构计算环境下的端到端推理性能,主要研究内容与贡献如下:

1)构建了输入感知的硬件自适应稀疏算子代码生成器。针对图数据不规则稀疏模式与硬件架构的适配难题,该生成器通过基于计算-访存比的稀疏模式分析实现动态分块以提升缓存局部性,并结合硬件特性(如CPU SIMDGPU SIMT),自动生成定制化的高性能微内核代码,为图神经网络推理提供了底层算子支撑。

2)提出了图算子与神经网络算子融合优化框架。针对算子交替执行引发的访存瓶颈,该框架将相邻内存密集型算子深度融合,实现片上高速缓存的中间数据直接复用。同时,引入轻量级代价分析模型高效剪枝复杂调度空间,搜索最优分块与并行策略,显著提升了端到端推理性能与缓存命中率。

3)设计了面向异构架构的并发图神经网络推理调度框架。针对多任务动态负载在CPU-GPU间的协同难题,该框架离线构建性能预测模型精准刻画执行开销,在线采用计算-通信协同感知的图划分算法最小化同步通信量,并构建跨设备异构流水线隐藏传输开销,实现了异构计算资源的精细化协同与调度。


主要学术成果

[1] He, Xianhao, et al. "An Input-Aware Sparse Tensor Compiler Empowered by Vectorized Acceleration." 2025 62nd ACM/IEEE Design Automation Conference (DAC). IEEE, 2025.(CCF A类会议,第一作者)

[2] He, Xianhao, et al. "PaSTG: A parallel spatio-temporal GCN framework for traffic forecasting in smart city." ACM Transactions on Sensor Networks (2024).(CCF B类期刊,第一作者)

[3] 何贤浩, et al. "面向天河新一代超算的大规模平行城市交通仿真." 软件学报 36.8 (2024): 3693-3708.(CCF A类中文期刊,第一作者)

[4] 王昊天, 丁岩, 何贤浩, 肖国庆, 阳王东. SparseMode:用于高效SpMV向量化代码生成的稀疏编译框架[J]. 计算机研究与发展, 2025, 62(6): 1443-1454.(CCF A类中文期刊,第三作者)

[5] Cai, Qinyun, et al. "COALA: A compiler-assisted adaptive library routines allocation framework for heterogeneous systems." IEEE Transactions on Computers 73.7 (2024): 1724-1737.(CCF A类期刊,第四作者)