课程主页: https://www.coursera.org/learn/feature-engineering-matlab
课程概述
《数据处理与特征工程(MATLAB)》是一门中级课程,旨在帮助学习者在MATLAB的探索性数据分析基础上,掌握为预测建模所需的技能。本课程特别适合那些需要结合来自多个来源或时间的数据并对建模感兴趣的学员。虽然没有编程背景的学习者也能够受益于此课程,但具备一定的领域知识和计算工具的使用经验将有助于成功完成课程学习。
课程大纲
1. 数据调查
在这个模块中,您将运用在MATLAB的探索性数据分析中获得的技能,对新的数据集进行调查。您将探索不同类型的分布,并计算偏度和四分位数等量值。此外,您还将学习更类型的可视化多维数据的图表。
2. 数据组织
您将在此模块中学习如何为分析准备数据。数据往往并未按需记录,您将学习如何操作字符串变量以提取关键信息,并将分散在多个列中的日期和时间信息合并为单一日期时间变量。此外,您还将高效加载和组合来自多个文件的数据,以形成最终分析所需的数据表。
3. 数据清理
在此模块中,您将学习如何清理混乱的数据。缺失数据、异常值和具有非常不同尺度的变量可能会掩盖数据中的趋势。您将发现并处理数据集中的缺失数据和异常值,并通过标准化变量来比较不同尺度的变量。
4. 查找重要特征
该模块将帮助您创造新特征,以便更好地理解数据。您将评估特征,以确定哪个特征在进行预测时可能有用。
5. 特定领域特征工程
您将应用前四个模块中的概念到不同的领域中。您将基于加速度计数据等时间信号创建和评估特征。同时,您还可以使用MATLAB中的应用程序进行图像处理,并基于分割的图像创建特征。此外,您还将使用文本处理技术在非结构化文本中查找特征。
总结
这门课程的内容系统且深入,实例丰富,非常适合希望在数据处理和特征工程领域提升技能的学习者。通过实际操作,您将能够真实地体验到数据科学的魅力。无论您是想为职业发展做准备,还是出于对数据分析的兴趣,这门课程都将是您的不二选择。
课程主页: https://www.coursera.org/learn/feature-engineering-matlab