Deep Learning Specialization on Coursera

课程主页: https://www.coursera.org/learn/missing-data

课程概述

在数据分析中,缺失数据是一个常见且具有挑战性的问题。Coursera上提供的《应对缺失数据》课程旨在帮助学习者掌握加权样本调查的步骤,包括调整非反应和使用外部数据进行校准的方法。本课程讨论了使用反应倾向估计、后分层、加权和一般回归估计的调整技术。

课程大纲

1. 加权的一般步骤

加权用于将样本扩大为总体。为此,需要纠正采样框中的覆盖错误,调整非反应,以及通过合并协变量来减少估计器的方差。第一模块涵盖了执行这一过程所需的一系列步骤。

2. 具体步骤

加权的具体步骤包括计算基本权重、在不确定资格的情况下进行调整、调整非反应以及使用协变量将样本校准到外部人口控制。我们将在此提供具体细节。

3. 实施步骤

软件在实施步骤中至关重要,而R系统是一个很好的免费工具来源。本模块覆盖了多个R包,包括sampling、survey和PracTools,用于选择样本和计算权重。

4. 缺失项的插补

在大多数调查中,受访者并未提供所有信息,尽管他们已经填写了足够的数据以被视为“完整”。如果只保留所有项目都完整的案例进行模型拟合,可能会排除相当多的案例。对缺失项目进行插补可避免丢失这些缺失案例。我们将在本模块中介绍插补的方法以及插补对标准误差的影响。

5. 课程总结

我们简要总结课程中所涉及的加权和插补方法。

为何推荐这门课程

如果你在研究或数据分析工作中遇到缺失数据,或者想了解如何正确处理与数据质量相关的问题,这门课程将是一个很好的起点。通过理论知识与软件实现相结合的方式,学习者可以有效掌握加权和插补的技术。无论是初学者还是有经验的数据科学家,这门课程都能为你提供宝贵的知识与技能。

课程主页: https://www.coursera.org/learn/missing-data

作者 CourseEye