
学位论文简介
随着人工智能技术的迅猛发展,人们对于高效、可解释且具备动态适应能力的模型落地方案迫切需求。如何在兼顾性能指标的同时,动态自适应适配不同场景与需求,已经成为当前学术界与工业界共同关注的焦点问题。因此,本文围绕强化学习的应用落地这一主题,在保证高效以及可解释的前提下,提出并构建了有助于实现强化学习算法动态适配不同场景与需求的模型和方法。取得了以下主要创新性研究成果:
为解决资源受限场景下的模型训练问题,结合模糊逻辑与卡尔莫格罗夫—阿诺德分解理论,提出了高效可解释强化学习方法,不仅显著减少了网络参数规模,降低了对计算资源的依赖,同时通过模糊规则及可视化赋予模型可解释决策能力。
为提升强化学习模型在不同任务环境中的高效知识迁移能力,结合样条函数的局部更新特性以及大模型的高效辅助决策能力,提出了一种针对多任务环境策略切换与知识迁移的方法,在切换环境训练过程中极大地避免了知识的遗忘,展现出在不同难度任务场景中的可拓展性。
为探究高维动态变化环境中强化学习算法的适应能力,利用可学习的度量与离散拉格朗日方法构建了对黎曼状态空间的表征,提出了一种关注黎曼状态空间细微结构变化的强化学习算法,使得智能体在不同状态区域内通过度量对策略优化方向及步长进行修正,为高维连续控制任务的算法适应能力及高效性提供了新的算法支撑。
为探索强化学习在具体医学图像领域的自适应能力,通过对核磁共振成像重建任务的马尔科夫决策过程构建,结合基于种群训练及多分支协作网络结构,提出了一种可解决核磁共振成像重建过程出现的伪影以及保真度不足的深度强化学习框架,取得了更低的重建误差与更高的图像质量,且提升了重建效率。
主要学术成果
Bo Zhao, Zhizhong Liu, Zhuo Tang. KAFQN: Kolmogorov-Arnold Fuzzy-guided Q-Network in Reinforcement Learning[C]//ICASSP 2025-2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2025: 1-5.(EI, 第一作者)
Bo Zhao, Zhuo Tang. GIST: Guided Interpretable Large Language Model Strategy Transfer for Multi-Task Reinforcement Learning[C]//ICASSP 2025-2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2025: 1-5. (EI, 第一作者)
Bo Zhao, Zhuo Tang, Zhizhong Liu, Kenli Li. Fuzzy-guided Riemannian Metric Reinforcement Learning for Continuous Control. IEEE Transactions on Fuzzy Systems(在审). (SCI,第一作者)
Bo Zhao, Zhizhong Liu, Zhuo Tang, Kenli Li. Deep Reinforcement Learning for Magnetic Resonance Imaging Reconstruction: A New Perspective. Knowledge-Based Systems(在审). (SCI,第一作者)