
学位论文简介
随着高性能计算与科学观测手段的不断发展,科学数据规模持续增长,数据存储、传输及处理面临日益严峻的挑战。在这种大规模数据环境下,如何在保证数据精度的前提下高效存储和处理科学数据,成为学界科学计算和工业界数据密集型应用亟需解决的核心问题。因此,本文基于科学数据压缩的应用需求,围绕数据预处理、近似中值计算效率与跨平台执行三个关键问题开展系统性研究,取得了以下主要创新性研究成果:
(1) 针对大规模科学数据规模持续增长所带来的存储与传输瓶颈问题,本文提出了一种基于总变差缩减的无损压缩预处理方法。该方法从总变差角度出发,通过引入由中值组成的虚拟参考超平面,对数据进行局部平滑处理提升其可压缩性,同时设计基于分桶策略的近似中值算法BAM,在保持高压缩比的同时提高压缩效率。
(2) 针对在流式处理场景中中值计算效率低、难以满足实时性的问题,本文提出了一种基于时空相似性的近似中值计算方法STREAM。该方法从时空相似性角度出发,通过跨数据段的统计信息复用机制减少重复计算,并基于可调粒度的分桶策略满足不同应用对精度和速度的差异化需求。
(3) 针对近似中值计算方法在不同硬件平台上适配性差、可移植性不足,缺乏统一实现机制的问题,本文提出一种架构无关的跨平台执行框架STREAM-ACE。该框架从分层设计角度出发,通过对STREAM的计算流程进行统一抽象与模块化组织,构建统一的执行接口与调度机制,支持STREAM在x86、ARM及GPU等多种计算环境中的高效执行,并通过平台特定优化策略提升算整体执行性能与可移植性。
主要学术成果
[1] Fenfang Li, Huizhang Luo, Weichen Liu, Anthony Theodore Chronopoulos, Kenli Li, Chubo Liu. STREAM: Spatiotemporal Similarity-based Efficient Approximate Median with Tunable Granularity[C]. 2025 62nd ACM/IEEE Design Automation Conference (DAC). IEEE, 2025: 1-6. (CCF-A类会议, 第一作者)
[2] Fenfang Li, Huizhang Luo, Junqi Wang, Yida Li, Zhuo Tang, Kenli Li. AMP: Total Variation Reduction for Lossless Compression via Approximate Median-based Preconditioning[J]. ACM Transactions on Embedded Computing Systems, 2024, 23(6): 1-22. (CCF-B类期刊, 第一作者)
[3] Fenfang Li, Huizhang Luo, Weichen Liu, Anthony Theodore Chronopoulos, Kenli Li, Chubo Liu. STREAM-ACE: Spatiotemporal Similarity-based Efficient Approximate Median with Architecture-agnostic Cross-platform Execution[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems. (CCF- A期刊, 第一作者,在投)
[4] Min Wu, Huizhang Luo, Fenfang Li, Yiran Zhang, Zhuo Tang, Kenli Li, Jeff Zhang, Chubo Liu. HSMU-SpGEMM: Achieving High Shared Memory Utilization for Parallel Sparse General Matrix-Matrix Multiplication on Modern GPUs[C]. IEEE International Symposium on High Performance Computer Architecture (HPCA). IEEE, 2025: 1452-1466. (CCF-A类会议, 第三作者)
[5] Yida Li, Huizhang Luo, Fenfang Li, Junqi Wang, Kenli Li. LAMP: Improving Compression Ratio for AMR Applications via Level Associated Mapping-based Preconditioning[J]. IEEE Transactions on Computers, 2023, 72(12): 3370-3382. (CCF-A类期刊, 第三作者)
[6] 李肯立, 李芬芳, 罗辉章, 阳王东, 唐卓, 刘楚波. 数据集的中值近似值查找方法、装置和计算机设备: CN114860811B[P]. 2024-09-17. (第二发明人,授权)
[7] 罗辉章, 周晓川, 李肯立, 李芬芳, 印东. 基于内存映射的超算系统热力学数据处理方法和装置: 202510508122X[P]. 2025-08-01. (第四发明人,实审)