课程主页: https://www.coursera.org/learn/complete-reinforcement-learning-system
在Coursera上,有一个极具挑战性的课程——《完整的强化学习系统(Capstone)》。这是强化学习专业中的最后一门课程,旨在将您从前面的三门课程中所学的知识综合运用到一个实际问题的解决方案中。在这个顶石项目中,您将经历完整的强化学习工作流,从问题表述到算法选择,再到参数选择和表示设计。
整个课程分为五个里程碑,每个里程碑都有其独特的任务,旨在帮助学员循序渐进地完成项目。
里程碑1:将问题形式化为MDP
这一周,您将阅读一个问题的描述,并将其翻译为马尔可夫决策过程(MDP)。您需要完成该环境的框架代码,为本项目提供可用的MDP。
里程碑2:选择合适的算法
在这一周,您需要从三种算法中选择一种,以学习该环境的策略。同时,评价每种算法在此环境中的适用性。
里程碑3:识别关键性能参数
本周,您将识别出影响您的代理性能的关键参数。这一任务旨在帮助您理解可选参数的范围,以便选择深入研究的参数。
里程碑4:实现您的代理
在这一周,您将使用期望Sarsa或Q学习(结合RMSProp和神经网络)来实现您的代理。您将验证代理的正确性。
里程碑5:提交参数研究!
在最后一周,您将选择一个参数进行研究,并在提供的参数范围内运行代理和环境,以确定不同参数下的性能。这将使您对参数对代理性能的影响有更深刻的理解,并可视化您所学习的代理。
经过这五个里程碑的学习和实践,您不仅能掌握强化学习的核心概念,还能将其应用到真实世界的问题中。因此,这门课非常适合希望在人工智能领域深耕的学员,是一个无与伦比的学习机会。
课程主页: https://www.coursera.org/learn/complete-reinforcement-learning-system