报告人:黄超,南安普顿大学副教授
报告时间:2024年5月15日 下午15:00
报告地点:信息科学与工程学院624
报告摘要:通过深度强化学习(DRL)或模仿学习(IL)训练的神经网络控制器在复杂甚至未知的环境中展示了出色的性能。然而,由于对安全性的考虑不足,现有的神经网络控制器很难部署在关键安全场景中。在本次报告中,将介绍在神经网络控制器的安全验证和设计方面的工作,包括先设计后验证和边设计边验证。具体来说,首先介绍了两种针对神经网络控制器的抽象技术,以支持系统级别的安全验证。然后提出了验证指导的强化学习,通过将验证纳入学习循环中来增强强化学习的安全性。本次报告的主要目的是讨论形式化方法如何辅助强化学习。
报告人简介:黄超,英国南安普顿大学副教授,美国西北大学兼职助理教授。研究方向包括机器学习技术的设计和验证,以及它们在机器人、交通等方面的应用。
邀请人:张羽丰
联系人:张羽丰