
学位论文简介
在计算机存储体系架构中,传统的Cache存储设备SRAM由于存储密度、泄漏功耗、可扩展性的劣势严重制约了Cache性能的发展。一种新型NVM存储器件MLC STT-RAM被认为是未来可替代SRAM的有利候选者,然而MLC STT-RAM在使用扩展编码技术解决TTs问题中面临的写延迟高、写能耗高及最优扩展编码查找时间复杂度高三大核心问题。本文在使用扩展编码方法解决TTs问题方向进行了深入探索,提出了三个相互独立且关联的研究模块,分别为zeroTT: MLC STT-RAM 写延时优化方案、AEIS:MLC STT-RAM 写能耗优化方案与EECS:高效扩展编码搜索优化方案。取得了以下主要创新性研究成果:
针对使用扩展编码技术解决TTs问题写延迟高的问题。本文首先系统分析了现有基于(2, 3) 的扩展编码方法的技术局限,证实其无法彻底消除TTs;随后提出一种基于(3, 4) 扩展编码的最优方案zeroTT,在平衡空间开销与编码复杂性的前提下,实现了TTs 的完全消除,从而实现写延迟的显著降低;最后深入剖析了(3, 4) 扩展编码方法能够根除TTs 而其他基于(��, �� ) 扩展编码方法无法实现的机理,以此验证zeroTT方案的正确性。
针对使用扩展编码技术解决TTs问题写延迟高的问题。本文首先探索并提炼出基于(��, �� ) 扩展编码方法消除TT 的的普适性规则;接着通过分析缓存行数据访问特性,发现数据更新时数据翻转主要发生在缓存行中的少数几个段中,这促使本文选择性地采用扩展编码;最后设计了优化的AEIS 编码方案,在彻底消除TTs 的基础上,实现写能耗的显著降低;
针对使用扩展编码技术最优扩展编码查找时间复杂度高的问题。本文首先深入剖析了基于(��, �� ) 扩展编码方法的TTs 的计算机制,通过将编码状态转换空间进行精细化细分,推导出TTs 数量的通用分段量化计算公式;接着将SA 算法引入最优编码搜索过程,提出一种SA 融合编码片段交换的高级搜索方法ASA,通过算法迭代与编码片段的启发式交换,提升最优解的搜索效率;最后通过分析编码空间的连续性特征,发现相邻候选扩展编码方案间存在显著相似性,基于这一特性提出一种增量计算策略:仅对编码变化部分重新计算TTs 数量,大幅减少重复计算开销,形成高效搜索方法ESA,可将时间复杂度降至��(2�� )。
主要学术成果
Dong Yin, Huizhang Luo, Jeff Zhang, Mingxing Duan, Wangdong Yang, Zhuo Tang, Kenli Li.zeroTT: A Two-Step State Transition Avoidance Scheme for MLC STT-RAM [C].61st ACM/IEEE Design Automation Conference (DAC ’24):210,1–6. (CCF-A 类会议,本人第一作者)
Dong Yin, Huizhang Luo, Yan Ding, Chubo Liu, Wenchao Zhao and Kenli Li.AEIS: A New Energy Efficiency Improvement Scheme for MLC STT-MRAM [J].IEEE Transactions on Computers(TC), 2026, 75(1):177–188. (CCF-A 类期刊,本人第一作者)
Dong Yin, Huizhang Luo, Qinrong Zhang, Kenli Li.An Efficient Search Approach for Expansion Coding Based on Adjacent Coding Similarity[C]. 63rd ACM/IEEEDesign Automation Conference (DAC ’26). (CCF-A 类会议,本人第一作者,在投)
Xiaochuan Zhou, Huizhang Luo, Huilong Pi, Dong Yin and Kenli Li.A Parallel Scheme for High-fidelity 3-D Thermal Simulations in Chip Design[C]. 63rdACM/IEEE Design Automation Conference (DAC ’26). (CCF-A 类会议,本人第四作者,在投)