题目:非梯度优化在强化学习中的应用
报告人:俞扬博士,南京大学副教授
主持人:周爱民
报告时间:2018年1月22日13:50-14:40
报告地点:中山北路3663号华东师范大学理科大楼B1002室
摘要:强化学习通过自主与环境交互,学习适应环境的最佳策略,已经显示出巨大的应用潜力。然而目前强化学习方法通常样本利用率低,依赖大量环境交互数据,获得最佳策略所需开销极大,阻碍了其在许多真实环境中的应用,其中一个原因在于梯度优化的工具的限制。本次报告将汇报我们基于非梯度优化方法提高强化学习效率方便的一些研究进展。
报告人简介:
俞扬,博士,南京大学副教授。主要研究领域为机器学习、强化学习、演化计算。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年中国计算机学会优秀博士学位论文奖。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS等,研究成果获得5项国际论文和竞赛奖。