答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈莘宁博士生预答辩公告
浏览次数:日期:2025-09-04编辑:

学位论文简介

多智能体强化学习作为实现群体协同的核心技术,凭借自主学习与动态优化的特性,在机器人协作控制、智能交通调度等领域展现出巨大应用潜力。然而,现有多智能体强化学习方法面对复杂环境仍存在探索效率低下,协作质量不佳等问题。论文围绕复杂环境下的多智能体协同开展研究取得了以下主要创新性研究成果:

  1. 针对序列式多阶段协同任务中目标依赖关系难以识别的问题,提出了一种目标一致性驱动的多阶段协同方法。通过联合学习目标认知表示,形成目标优先级认知。同时,通过约束目标一致性,促进智能体形成一致目标认知,显著提升了多智能体在序列式的多阶段任务中的学习效率。

  2. 针对稀疏奖励环境下的多智能体并行协同任务面临的有效经验匮乏问题,提出一种基于选择性经验复用的多智能体协同方法。通过生成高价值回溯轨迹引导智能体有效探索目标并选择性地聚合智能体信息,实现训练效率与学习的平稳性的平衡。该方法提升了在多个稀疏奖励的并行协同任务中具有更高的学习效率与协同性能,并且在处理大规模智能体场景时展现出明显优势。

  3. 针对异构智能体场景下目标选择不合理导致协同效率低下问题,提出一种基于能力匹配的分层强化学习方法。该方法引入了能力评估模型,实现智能体能力量化与目标难度评估。同时,通过设计基于能力的内在奖励机制,避免了因趋易性导致的协同低效。

  4. 针对强化学习中探索策略缺乏通用性的问题,提出一种基于双向奖励噪声的通用探索方法。通过针对性地引入不同方向的噪声来调节奖励信号,引导智能体更充分地探索环境。该方法可以与现有的强化学习算法相结合,在不引入额外训练开销的情况下有效提升算法的探索性能,避免算法在早期收敛于次优。

主要学术成果

  1. Xinning Chen, Xuan Liu, Shigeng Zhang, Bo Ding, KenLi Li. Goal Consistency: An Effective Multi-Agent Cooperative Method for Multistage Tasks. International Joint Conference on Artificial Intelligence, 2022: 172-178. (CCF A类会议,第一作者)

  2. Xinning Chen, Xuan Liu, Yanwen Ba, Shigeng Zhang, Bo Ding, Kenli Li. Selective Learning for Sample-Efficient Training in Multi-Agent Sparse Reward Tasks. European Conference on Artificial Intelligence, 2023: 413-420. (CCF B类会议,第一作者)

  3. Xuan Liu, Xinning Chen, Qiuying Yang, Shigeng Zhang, Song Guo, Juan Luo, Kenli Li. More Than Scheduling: Novel and Efficient Coordination Algorithms for Multiple readers in RFID Systems. IEEE Transactions on Mobile Computing, 2023, 22(9): 5375-5388. (CCF A期刊,第作者)

  4. Xinning Chen, Kehua Yang, Xuan Liu, Ying Xu, Juan Luo, Shigeng Zhang. Efficient and Accurate Identification of Missing Tags for Large-scale Dynamic RFID Systems. Journal of Systems Architecture, 2022,124: 102394. (SCI-2,第一作者)

  5. Xinning Chen, Xuan Liu, Canhui Luo, Jiangjin Yin. Robust multi-agent reinforcement learning for noisy environments. Peer-to-Peer Networking and Applications, 2022, 15(2): 1045-1056. (CCF C类期刊,第一作者)