答辩公告
我的位置在: 首页 > 答辩公告 > 正文
杜琦博士预答辩公告
浏览次数:日期:2026-03-04编辑:

学位论文简介

本文围绕深度学习分子动力学在高性能计算环境中的系统级性能瓶颈,提出了一套统一的跨平台计算与性能抽象框架,并在此基础上开展了覆盖指令级、线程级与进程级的全栈式优化研究。主要创新点包括:

  1. 提出了统一跨平台的深度学习势能计算性能抽象框架。针对神经网络与图神经网络两类主流深度学习势能模型,本文从并行计算视角对其推理过程进行统一形式化刻画,将复杂的模型计算归纳为“消息生成—特征聚合—状态更新”三个具有明确计算与通信特征的计算阶段。

  2. 构建了面向向量化体系结构的自适应高性能计算内核与协同执行机制。在指令级优化层面,本文针对现代向量扩展体系结构的特点,提出了矩阵规模与缓存层次协同建模的自适应优化方法,并据此设计与实现了高性能双精度矩阵计算微内核。

  3. 提出了覆盖节点内与节点间多层次并行瓶颈的系统协同优化方法。针对深度学习分子动力学在多核与大规模分布式环境下面临的性能瓶颈,本文突破了传统研究聚焦单一并行层级的局限,构建了一套贯穿指令级、线程级与进程级的全栈式优化方案。

  4. 在真实大规模科学模拟场景中系统验证了所提方法的泛化能力与实用价值。本文将所提出的统一抽象框架与多层次优化方法集成于主流深度学习分子动力学软件栈中,并在多个具有代表性的科学算例及超大规模并行模拟场景中进行了系统性验证。

主要学术成果

  1. Qi DuFeng Wang, Chengkun Wu. Parallelization Strategies for DeepMD-kit UsingOpenMP: Enhancing Efficiency in MachineLearning-Based Molecular Simulations[J]. IEEE Transactions on Computers, 2025:3534-3545. (CCF A, SCI, 本人第一作者)

  2. Qi DuFeng Wang, Chengkun Wu, Han Wang, Yongpeng Liu, Zhaoyin Zhou, Kenli Li. Scaling Deep Learning Molecular Dynamics to 500M Atoms on 4096-Node ARMv8 Clusters.[C]//2025 The IEEE International Conference on Cluster Computing (Cluster). Edinburgh, UK, 2025:1--12. (CCF B, 会议唯一最佳论文, EI, 本人第一作者)

  3. Qi DuFeng Wang, Hui Huang, Jinlin Chen. Improving LAMMPS performance for molecular dynamic simulation on large-scale HPC systems[J]. The Computer Journal, 2025:706716. (CCF B, SCI, 本人第一作者)

  4. Qi DuFeng Wang, Hui Huang, Heng Wan, Xiaoyu Wu, Chengkun Wu. Exploring Natural Language Processing Model Acceleration in Molecular Dynamics Simulation Using High-Performance Computing and Machine Learning.[C]//2024 International Conference on Bioinformatics and Biomedicine (BIBM). Lisbon, Portugal, 2024:1479--1484. (CCF B, EI, 本人第一作者)

  5. Qi DuFeng Wang, Hui Huang. Exploring the performance of CP2K simulations on the CPU-GPDSP Fusion intra-heterogeneous HPC system[J]. Future Generation Computer Systems, 2026, 174:107912.. (CCF C, SCI, 本人第一作者)