答辩公告
我的位置在: 首页 > 答辩公告 > 正文
胡道坤博士生答辩公告
浏览次数:日期:2024-01-09编辑:

学位论文简介

本文的研究目标不仅在于解决持久内存哈希索引和缓存系统的特有问题,也对持久内存系统的一些共性问题展开有益探索。本文的研发成果能够直接应用到面向持久内存系统的各类软件系统(如,主存数据库系统,文件系统,键值存储系统等)的开发,以确保这类系统的可用性和可靠性,具有较高的应用价值和现实意义。基于本文的研究成果有望构建出高吞吐、低延迟的存储引擎,促进内存存储技术在数据中心的大规模应用,为联机事务分析和处理、大数据分析、智能驾驶等重要应用提供支撑。取得了以下主要创新性研究成果:

1. 针对持久哈希索引的评估中面临的基准测试框架指标不全、接口和数据集不统一、评估环境缺乏硬件基础等问题,设计了一个用于评估持久内存哈希索引结构性能的基准测试框架。基于该框架对当前最具代表性的几种持久内存哈希索引进行了深入的性能评估。通过对实验结果的分析,本文不仅从硬件体系结构和数据结构空间布局两个层次剖析了设计高性能持久哈希索引面临的挑战以及可能的解决办法,还从本次量化分析中提炼出有助于提升持久哈希索引性能、促进持久哈希索引普及应用的优秀设计范式,准确定位到了影响持久哈希索引性能的关键因素。

2. 持久内存系统上的哈希索引的性能受到来自上层应用与底层硬件的访存粒度不匹配和内存分配器、同步原语引起的严重持久内存写放大的限制。现有研究试图利用DRAM 和持久内存异构内存架构来克服访存粒度不匹配的影响,构建出具有更高吞吐量的混合索引结构,但这种设计方案以极长的恢复时间为代价,并且引入了查询时既要读DRAM 又要读持久内存的混合读问题。对此,本文研究随机小写顺序化方法,突破访存粒度不匹配对持久内存哈希索引性能的限制;构建基于大内存块的堆结构,实现堆元数据一致性维护从关键路径上解耦的轻量级内存管理机制,避免关键路径上高开销引起的写性能抖动;研究有助于降低运行时开销、提升恢复性能的反应式快照技术。基于上述内容,实现了一种基于DRAM 和持久内存异构内存架构的恢复友好的哈希索引Halo 哈希。在配置了Intel Optane DCPMM 32 核双路至强第二代可扩展处理器上的实验结果表明,在各种工作负载下,Halo 的读、写吞吐量最高分别是同类系统的17.5 倍和81.2 倍,恢复速度比其他基于DRAM 和持久内存混合设计的哈希索引快12 个数量级。

3. 当前的持久内存缓存系统要么没有意识到持久性内存的性能特征而直接采用传统缓存策略,要么缺乏能够利用持久性内存使内存中的缓存可快速恢复的关键设计。针对基于持久内存的键值缓存系统,提出了Hemu,一个 DRAM 和持久内存混合架构的缓存系统,其具有高吞吐量、可扩展性、高效率空间管理、快速恢复的特性。利用位于 DRAM 中定制的易失性哈希索引结构和持久内存中日志结构的数据分布,最后情况下,Hemu 的性能优于现有的持久内存缓存系统,Hemu 的性能比现有的基于持久内存的键值缓存系统,在吞吐量上至高提升了218 倍,恢复性能提升了84 倍,尾延时降低了8600 余倍。

主要学术成果

  1. Daokun Hu, Zhiwen Chen, Wenkui Che, Jianhua Sun, and Hao Chen. 2022. Halo: A Hybrid PMem-DRAM Persistent Hash Index with Fast Recovery. In Proceedings of the 2022 International Conference on Management of Data (SIGMOD ’22). Association for Computing Machinery, New York, NY, USA, 1049–1063.CCF A 类会议,本人一作)

  2. Daokun Hu, Zhiwen Chen, Jianbing Wu, Jianhua Sun, and Hao Chen. 2021. Persistent memory hash indexes: an experimental evaluation. Proc. VLDB Endow. 14,5 (January 2021), 785–798.CCF A 类会议,本人一作)

  3. Zhiwen Chen, Daokun Hu, Wenkui Che, Jianhua Sun, and Hao Chen. 2023. A quantitative evaluation of persistent memory hash indexes. The VLDB Journal (2023),1–23.CCF A 类期刊,并列一作

  4. Bang Di, Daokun Hu, Zhen Xie, Jianhua Sun, Hao Chen, Jinkui Ren, and Dong Li. 2021. TLB-pilot: Mitigating TLB Contention Attack on GPUs with Microarchitecture-Aware Scheduling. ACM Transactions on Architecture and Code Optimization (TACO) 19, 1 (2021), 1–23.CCF A 类期刊, 并列一作

  5. Zhiwen Chen, Wenkui Che, Daokun Hu, Xin He, Jianhua Sun, and Hao Chen. 2023. On the Performance Intricacies of Persistent Memory Aware Storage Engines. IEEE Transactions on Knowledge and Data Engineering (2023).CCF A 类期刊

  6. Can Peng, Chenlin Huang, Daokun Hu, Di Bang, Jianhua Sun, Hao Chen, and Xionghu Zhong. 2019. Address randomization for dynamic memory allocators on the gpu. In 2019 IEEE 21st International Conference on High Performance Computing and Communications; IEEE 17th International Conference on Smart City; IEEE 5th International Conference on Data Science and Systems(HPCC/SmartCity/DSS),IEEE, 570–577.CCF C 类会议

  7. Jiang Wu, Bang Di, Jianhua Sun, Hao Chen, Xionghu Zhong, DaoKun Hu, and Chenlin Huang. 2019. A fast and secure GPU memory allocator. In 2019 IEEE 21stInternational Conference on High Performance Computing and Communications; IEEE 17th International Conference on Smart City; IEEE 5th International Conference on Data Science and Systems (HPCC/SmartCity/DSS), IEEE, 146–153. CCF C 类会议