课程主页: https://www.coursera.org/learn/complete-reinforcement-learning-system
在Coursera上,我们隆重推荐一门课程:《完整强化学习系统(Capstone)》。这是强化学习专项课程的最后一门课。在这门课程中,您将综合运用前面三门课程的知识,实施一套完整的强化学习解决方案来解决实际问题。通过这个项目,您将看到每个组件——问题表述、算法选择、参数选择和表示设计——如何融合成一个完整的解决方案,以及如何在真实世界中部署强化学习时做出合适的选择。
课程大纲包括多个里程碑:
1. **将文字问题形式化为MDP**:您将阅读问题描述,并将其翻译为马尔可夫决策过程(MDP)。
2. **选择合适的算法**:在这一周,您将从三种算法中进行选择,以学习环境的策略,并探讨每种算法在该环境中的适用性。
3. **识别关键性能参数**:您将识别影响代理性能的关键参数,了解各种选项,以便后续深入研究。
4. **实现您的代理**:使用期望Sarsa或Q学习与RMSProp和神经网络实现代理,同时验证其正确性。
5. **提交您的参数研究成果**:选择一个参数进行研究,运行代理和环境的参数设置,深入了解参数对代理性能的影响,并可视化学习结果。
这门课程是希望深入理解和实践强化学习的学习者的绝佳机会,不要错过!
课程主页: https://www.coursera.org/learn/complete-reinforcement-learning-system