在线学习与决策

任课教师 Speaker:周源
时间 Time: 每周一&三15:20-16:55, 9.13-12.3
地点 Venue:西楼第一会议室

课程描述 Description

本课程将涵盖在线学习和在不确定性下进行最优决策的基础与前沿算法设计和分析技术。在线学习和最优决策问题在在线广告、推荐系统、众包、收益管理等方面有着广泛的应用,并在算法、机器学习和运筹学等领域有广泛的研究。

在本课程中,我们将专注于在线学习和最优决策的一些核心问题(如多臂赌博机,线性赌博机,增强学习)并探讨普遍性的算法技术以达到收集数据和最优决策之间的最优权衡(也称为探索—利用权衡)。作为补充,我们也将讨论一些下界(不可能性)定理,以证明相关算法的最优性。