学位论文简介
本论文围绕异构计算系统高效能调度策略与算法展开研究工作,主要工作内容和创新点如下:
首先,研究异构计算系统上能量受限并行应用程序的调度长度最小化(MSLEC)问题。分别定义了任务能量需求率和能量分配因子概念,以合理分配可分配能量。提出一种两阶段混合能量分配(HEA)策略,并根据能量分配因子将可分配能量分为两部分,即静态预分配能量(SAE)和动态预分配能量(DAE)。在第一阶段,在任务调度之前根据最小能量需求和能量需求率为每个任务预先分配SAE。在第二阶段,在调度算法的操作过程中动态地将DAE 定位到每个任务,并对所提出的策略的可行性给出了严格的数学证明。
然后,研究针对在不使用容错的情况下,在保证异构分布式嵌入式系统(HDES)中并行应用程序可靠性目标的同时最小化调度长度(MSLRG)问题。并将该问题分解为两个子问题,即保证可靠性目标和最小化调度长度。第一个子问题通过定义计算需求率(CDR)的概念,并以合理地将应用程序的可靠性目标转移到每个任务。第二个子问题通过启发式地为每个任务分配最早完成时间最小的处理器,并同时保证其可靠性目标。在此基础上,提出了MSLRG算法来解决该问题。
接着,研究异构计算系统(HCS)上能量受限并行应用程序的可靠性和性能感知调度问题。首先,引入能量需求率(EDR)的能量预分配机制来合理地预分配能量。其次,提出一种基于EDR的能量约束并行应用可靠性最大化(EMREC)调度算法。在此基础上,考虑到最大化可靠性会导致调度长度过长和不可接受,进一步提出了可靠性-性能比(RPR)的概念。更进一步,提出一种面向能量受限并行应用程序的可靠性-性能比(RPR)最大化调度算法(MRPEC)调度算法,使得并行应用具有较小的调度长度,同时具有较高的可靠性。与相关算法相比,表明了所提出的两种算法在调度性能和可靠性方面的有效性。
最后,针对新型异构 5G 移动边缘计算(MEC)系统中,移动用户设备(UE)的体验质量 (QoE),提出了一种基于博弈论的 MEC 应用计算卸载算法。通过考虑 UE 的 QoE 要求建立了 MEC 计算卸载模型,并讨论了通信、计算和能耗模型。考虑到有多个 UE 希望将其计算任务卸载到资源受限的 MEC 服务器上,并且每个 UE 都是自私和竞争的。将计算卸载决策问题制定为非合作博弈模型,并证明了所提出的博弈模型存在纳什均衡 (NE)解决方案。在此基础上提出了一种算法,在其 QoE 偏好下联合优化每个UE的能耗和时延,并为每个 UE 实现最佳卸载收益。并且, 提出了一种计算卸载博弈 (COG) 算法来有效地找到 NE 解决方案。仿真结果表明,所提出的 COG 算法可以在具有不同大小 UE 的 MEC 场景中有效地找到 NE 解决方案。
在真实和随机生成的计算应用上实验结果表明,与相关研究相比,本文所提出的算法可以明显地提升系统的计算效能。
主要学术成果
Jiwu Peng, Kenli Li, Jianguo Chen, and Keqin Li. HEA-PAS: A hybrid energy allocation strategy for parallel applications scheduling on heterogeneous computing systems. Journal of Systems Architecture, 2022, 122:1383-7621. (第 一 作 者, CCF B类 期 刊,影响因子:5.836)
Jiwu Peng, Kenli Li, Jianguo Chen, and Keqin Li. Reliability/Performance-aware Scheduling for Parallel Applications with Energy Constraints on Heterogeneous Computing Systems. IEEE Transactions on Sustainable Computing, 2022, doi: 10.1109/TSUSC.2022.3146138. (第一作者, 影响因子:4.908)
Jiwu Peng, Zheng Xiao, Cen Chen, Wangdong Yang. Iterative sparse matrix-vector multiplication on in-memory cluster computing accelerated by GPUs for big data. ICNC-FSKD 2016: 1454-1460 (第一作者, EI国际会议)
Linlin Zhuo, Kenli Li, Hao Li, Jiwu Peng, Keqin Li. An online and generalized non-negativity constrained model for large-scale sparse tensor estimation on multi-GPU. Neurocomputing, 2020, 399: 18-36. (SCI 2区刊源)
Wei Ai, Kenli Li, Cen Chen, Jiwu Peng, Keqin Li. DHCRF: A Distributed Conditional Random Field Algorithm on a Heterogeneous CPU-GPU Cluster for Big Data. ICDCS 2017: 2372-2379 (CCF B类会议)
Hao Li, Kenli Li, Jiwu Peng, Junyan Hu, Keqin Li. An Efficient Parallelization Approach for Large-Scale Sparse Non-Negative Matrix Factorization Using Kullback-Leibler Divergence on Multi-GPU. ISPA/IUCC 2017: 511-518 (CCF C类会议)
Hao Li, Kenli Li, Jiwu Peng, Keqin Li: CuSNMF: A Sparse Non-Negative Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on Multi-GPU. ISPA/IUCC 2017: 1144-1151 (CCF C类会议)
陈建国 李肯立 彭继武 胡俊艳 刘楚波 李克勤 廖湘科 张尧学. 计算任务卸载系统与方法:中国,CN201910427002.1. 2019-10-25.
李肯立, 陈建国, 彭继武, 胡俊艳, 阳王东, 李克勤, 廖湘科. Coflow协同作业流调度感知的数据流划分方法与装置:中国,CN201910594800.3. 2019-10-11.
陈建国, 李肯立, 刘刚, 彭继武, 李克勤. 一种面向Df-PBS系统的公共自行车站点动态规划方法和系统:中国,CN202010226676.8. 2020-08-04.