课程主页: https://www.coursera.org/learn/introduction-to-machine-learning-supervised-learning
在这门课程中,学员将深入探讨各种监督学习算法及其在不同数据上的应用预测任务。课程内容不仅涉及如何使用不同的模型及其原因,还讲解了如何提升模型的性能。
这门课程包含多个重要的机器学习模型,包括线性回归、逻辑回归、K近邻、决策树及集成方法如随机森林和提升等。更高级的核方法如支持向量机 (SVM) 也将被详细介绍。
首先,课程让学生建立监督机器学习的基础,强调数据清洗和探索性数据分析 (EDA) 的重要性。尽管这些过程看似枯燥,但它们对于数据项目的指导至关重要。
接下来的模块将逐步深入学习多元线性回归和逻辑回归等经典的统计工具,并通过实用的实验来应用这些算法。虽然逻辑回归名称中带有“回归”二字,但它实际上用于分类任务。
在学习非参数模型模块时,学生将接触到K近邻算法和决策树的基本概念,并利用这些模型处理实际数据集,如著名的MNIST数据集。课程最后的集成方法模块将探讨如何通过随机森林、包外抽样(Hashing)和提升等技术来克服模型过拟合的问题。
支持向量机作为一个高级话题,旨在通过对硬边界与软边界的理解及超参数调优,帮助学生掌握这一强大的监督学习模型。
此课程尤其适合那些拥有一定编程或脚本编写基础的学员,课程中将广泛使用Python进行实践。
总的来说,这门课程为想要提升机器学习技能的学习者提供了系统化的知识架构,让学员从基本算法起步,逐步掌握复杂模型的构建与调优。
课程主页: https://www.coursera.org/learn/introduction-to-machine-learning-supervised-learning