报告题目:策略迭代:一类强化学习优化控制方法
报告人:罗彪
主持人:范泉涌
报告时间:2021年11月11日(周四)下午15:00
报告地点:腾讯会议:ID 697 259 619
报告简介:本报告将详细的分析一类强化学习优化控制方法:策略迭代。对于连续时间系统,分别针对线性系统、仿射非线性系统及非仿射非线性系统,分析策略迭代方法的起源和发展历程、从理论上分析了策略迭代方法与逐次逼近法的等价性。
报告人简历:罗彪,中南大学bwin必赢教授、博士生导师、IEEE Senior Member、获得国家优秀青年科学基金、湖南省杰出青年科学基金、2015年中国自动化学会优秀博士论文获得者。2014-2018年在中国科学院自动化研究所任助理研究员、副研究员。发表论文70余篇。 现担任中国自动化学会(CAA)自适应动态规划与强化学习专业委员会秘书长;担任国际期刊《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Emerging Topics in Computational Intelligence》、《Artificial Intelligence Review》、《Neurocomputing》与《Journal of Industrial & Management Optimization》、《工程科学学报》的编委;担任CAA新一代信息技术科技服务团专家。目前研究兴趣主要有:智能控制/决策/博弈、深度学习、强化学习、计算智能、图像处理及计算视觉、人在回路技术、无人驾驶/无人机/机器人。