课程主页: https://www.coursera.org/learn/fundamentals-of-reinforcement-learning
在当今人工智能迅猛发展的时代,强化学习作为机器学习的一个重要分支,正在逐渐走入公众的视野。如果你对决策制定和自动化智能感兴趣,Coursera 上的“强化学习基础”课程将是一个不可错过的选择。该课程由阿尔伯塔大学和 Onlea 联合推出,共分为四部分,是入门强化学习领域的理想起点。
课程的第一部分是课程欢迎模块。在这里,你将认识到授课教师,并了解整个课程的安排和期望。接下来的第一周将专注于顺序决策的引入,尤其是探索与利用的权衡。这一周的评估内容是实现并测试一个 epsilon-greedy 代理,有助于巩固对探索不同算法优缺点的理解。
随后,你将学习马尔可夫决策过程(MDP),这是工业中解决问题的核心。良好的MDP建模将直接影响解决方案的质量。本周的任务是创建三个符合 MDP 框架的例子,加深理解。之后,课程将进入价值函数和贝尔曼方程的内容,这些是优化策略的关键工具。
在动态编程模块中,你将学习如何计算价值函数和最优策略,并实现在模拟工业控制问题中高效的动态编程代理。这将帮助你理解动态编程在工业应用中的重要性。整门课程涵盖了强化学习的核心概念及其在现实世界中的应用,适合希望了解智能决策的各类学员。
总之,如果你对自动化和智能代理有浓厚的兴趣,这门课程将为你打开一个全新的视野,让你逐步掌握强化学习的基础知识,并为更深入的学习奠定坚实的基础。
课程主页: https://www.coursera.org/learn/fundamentals-of-reinforcement-learning