
学位论文简介
键值存储引擎作为支撑数据存储的底层组件,在当今高性能计算,数据库等领域具有不可或缺的地位。由具备持久存储以及字节寻址能力的持久内存与普通高速内存组成的异构内存系统是一种具有代表性的新型存储架构。基于上述架构设计高可用、低延迟的键值存储引擎成为存储系统研究的新兴发展方向。如何优化基于持久内存的键值存储引擎性能;如何设计完备的持久内存安全机制从而实现高可用高性能的键值存储引擎是本工作希望通过系统设计研究以及定量实验分析去回答的问题。基于上述问题与挑战,本文的工作主要进行了以下研究:
(1) 针对现有基于持久内存键值存储引擎忽视内存管理开销的影响、缺少真实硬件评测依据、实验指标缺乏等问题,本工作设计了一套面向持久内存感知的键值存储引擎的评测框架。在真实硬件平台上,使用该框架针对三种不同架构的键值存储引擎原型实现进行了大量实验。基于实验结果总结出了多条有助于优化键值存储引擎性能的建议。
(2) 针对持久内存范围索引工作在应用场景中暴露的一系列问题:包括并发控制策略欠佳、线程阻塞严重、持久化指令开销高、对持久内存访存模式的不友好性以及DRAM资源开销过大等,本工作设计了一个具备数据缓存能力的高性能持久内存B+树索引系统,ZBTree。ZBTree通过一系列创新设计缩减DRAM空间开销,提升读写性能,并且可以保证可靠的故障恢复能力。
(3) 针对持久内存键值存储引擎在测试场景下暴漏的可靠性问题:例如第三方持久内存分配器无法被检测机制感知、无法适配传统DRAM访存安全检测技术等,本工作提出一种面向持久内存的低开销安全检测技术PMsan。PMsan通过自动化插桩检测以及重构分配器的方式实现对键值存储引擎访存错误的运行时检测功能。它解决了已有持久内存检测技术开销大、精度低的问题,充分结合持久内存键值存储引擎的访存特点进行优化。实验结果表明,在与现有持久内存安全检测工作具有相同检测精度的前提下,PMsan的检测开销可以降低最多3倍,显著提升检测效率。
主要学术成果
[1] Wenkui Che, Zhiwen Chen, Daokun Hu, Jianhua Sun and Hao Chen. 2024. ZBTree: A Fast and Scalable B+-Tree for Persistent Memory. IEEE Transactions on Knowledge and Data Engineering (2024). (CCF A类期刊, 一作)
[2] Zhiwen Chen, Wenkui Che, Daokun Hu, Xin He, Jianhua Sun, and Hao Chen. 2023. On the Performance Intricacies of Persistent Memory Aware Storage Engines. IEEE Transactions on Knowledge and Data Engineering (2023). (CCF A类期刊, 并列一作)
[3] Wenkui Che, Zhiwen Chen, Daokun Hu, Jianhua Sun and Hao Chen. PMsan: A PMem-aware Sanitizer with Tag-based Filtering (已投稿CCF A类会议,一作)
[4] Daokun Hu, Zhiwen Chen, Wenkui Che, Jianhua Sun, and Hao Chen. 2022. Halo: A Hybrid PMem-DRAM Persistent Hash Index with Fast Recovery. In Proceedings of the 2022 International Conference on Management of Data (SIGMOD '22). Association for Computing Machinery, New York, NY, USA, 1049–1063. (CCF A类会议)
[5] Zhiwen Chen, Daokun Hu, Wenkui Che, Jianhua Sun, and Hao Chen. 2023. A quantitative evaluation of persistent memory hash indexes. The VLDB Journal (2023), 1–23. (CCF A类期刊)