报告:多臂老虎机简介:模型、算法与应用 (黄增峰)
报告时间:2024年11月7日10:30-11:30
报告地点:数学馆310室
讲者简介:
复旦大学教授,博导,入选国家级青年人才计划。在国际期刊和会议上(ICML,NeurIPS, JMLR, FOCS, TIT等)发飙高水平论文五十余篇,荣获了多项国际奖项,包括ICML 2018最佳论文亚军奖(bset paper runner uo award),两次世界人工智能大会青年优秀论文提名奖(2020, 2023), 以及ACM PODS 2022时间检验奖。
报告摘要:
多臂老虎机问题及其推广是在线学习中的经典模型,在人工智能和运筹优化等领域都受到了大量关注,在临床试验、广告投放和推荐系统等也有着广泛的实际应用。在本次报告中,我将简要回顾该问题的标准设置和经典算法。然后,讨论近年来受到实际应用启发并得到广泛研究的非传统模型,例如批量反馈MAB、Lipschitz老虎机以及带有反馈图的MAB等。最后,还将探讨MAB算法在其他AI和运筹问题上的应用。