答辩公告
我的位置在: 首页 > 答辩公告 > 正文
叶文华博士点答辩公告
浏览次数:日期:2025-11-20编辑:

学位论文简介

随着深度学习在自然语言和机器视觉的蓬勃发展,诞生了众多神经网络,由于其巨大的计算量和参数,对运行的硬件平台和系统提出了较高的挑战。本文主要研究基于FPGA的深度神经网络计算加速技术,分析梳理了关键挑战,在CPU+FPGA的异构硬件平台上,通过软硬件协同设计了可重构加速器架构、高效计算模块、多级交织缓存技术以及多核处理方法,取得了以下主要创新性成果:

1. 由于CNN在具体应用中需要对网络结构、网络层数等进行定制,同时计算量随着网络的加深而激增,针对这些挑战,本文提出一种基于FPGA网络可重构的CNN加速方法,可动态配置CNN图像、卷积核、池化等尺寸和网络的结构层数。FPGA内采用多通道并行流水线矩阵乘法和数据交织缓存方法来实现CNN的卷积层和全连接层。

2. 注意力机制密集的矩阵计算和复杂的数据流给加速器架构提出了巨大的挑战。本文提出一种基于高效可重构脉动阵列FPGA的注意力加速方法,其具有可重构架构、数据感知脉动阵列和对硬件友好的基2归一化指数模块。架构能动态配置FPGA计算过程,脉动阵列能自动重构计算方式使其负载平衡。

3. ViT作为目前热度最高的基于transformer的视觉模型,其巨大的计算量和参数,限制了对于实时性要求较高的应用场景。本文提出了一种基于多数据流FPGAViT加速方法,以高性能矩阵计算模块为核心,通过多个数据流串联各个功能模块,以流水线方式切分数据,在各个模块内以一致的并行度进行计算。能适应多种不同大小ViT模型。

本文提出的三种加速器都在CPU+FPGA的异构硬件实验平台上进行了多项测试,包括加速器架构的适应性、加速能力和能耗表现等,实验结果表明,相较于传统CPUGPU平台,本文基于FPGA的加速设计在加速比和能效比方面均展现出了一定的优势,具有较大的应用价值。


主要学术成果

学术论文:

[1] Wenhua Ye, Xu Zhou, Joey Zhou, Cen Chen, and Kenli Li. 2023. Accelerating Attention Mechanism on FPGAs based on Efficient Reconfigurable Systolic Array. ACM Trans. Embedd. Comput. Syst. 22, 6, Article 93(November 2023), 22 pages. (已发表,第一作者,CCF推荐B类期刊,SCI 3)

[2] Wenhua Ye, Huan Li, Xu Zhou, Huilong Pi, and Kenli Li. 2025. A Design of Network Reconfigurable Universal CNN Accelerator Based on FPGA. ACM Trans. Embedd. Comput. Syst.(已录用,第一作者,CCF 推荐B类期刊,SCI 3区)

[3] Wenhua Ye, Huan Li, Xu Zhou, Dong Pan, and Kenli Li. 2025. MDS-ViT: A Multi-Data Stream FPGA-Based Vision Transformer Accelerator. Journal of Systems Architecture.(审稿中,第一作者,CCF推荐B类期刊,SCI 2区)

[4] Li Chuang, Chen Wenyu, Liu Gang, Tan Changyao, Liu Limei, Ye Wenhua, Chronopoulos Anthony Theodore. 2025  VM-ORAM: A Novel High-Performance ORAM Architecture for Efficient Data Integrity Verification in Industrial Cloud. IEEE Transactions on Industrial Informatics.(已录用,共同作者,CCF推荐C类期刊,SCI 1区)


发明专利:

[1] 李肯立,叶文华,周旭,刘楚波,陈岑,肖国庆,阳王东。一种基于CNN和组合高阶谱图像的调制样式识别方法和系统。 国家发明专利。 (第二发明人,授权,专利号:202110782131.X)

[2] 李焕,叶文华,周旭,刘刚,李肯立,李克勤。一种基于FPGA数据压缩的高效矩阵相乘方法和系统。 国家发明专利。 (第二发明人,已受理)

[3] 李肯立,李焕,周旭,叶文华,唐卓,刘楚波,肖国庆,李克勤。一种基于FPGA组件设计的资源重构方法和系统。 国家发明专利。 (第四发明人,已受理)