课程主页: https://www.coursera.org/learn/missing-data
课程概述
在数据分析中,缺失数据是一个常见且具有挑战性的问题。Coursera上提供的《应对缺失数据》课程旨在帮助学习者掌握加权样本调查的步骤,包括调整非反应和使用外部数据进行校准的方法。本课程讨论了使用反应倾向估计、后分层、加权和一般回归估计的调整技术。
课程大纲
1. 加权的一般步骤
加权用于将样本扩大为总体。为此,需要纠正采样框中的覆盖错误,调整非反应,以及通过合并协变量来减少估计器的方差。第一模块涵盖了执行这一过程所需的一系列步骤。
2. 具体步骤
加权的具体步骤包括计算基本权重、在不确定资格的情况下进行调整、调整非反应以及使用协变量将样本校准到外部人口控制。我们将在此提供具体细节。
3. 实施步骤
软件在实施步骤中至关重要,而R系统是一个很好的免费工具来源。本模块覆盖了多个R包,包括sampling、survey和PracTools,用于选择样本和计算权重。
4. 缺失项的插补
在大多数调查中,受访者并未提供所有信息,尽管他们已经填写了足够的数据以被视为“完整”。如果只保留所有项目都完整的案例进行模型拟合,可能会排除相当多的案例。对缺失项目进行插补可避免丢失这些缺失案例。我们将在本模块中介绍插补的方法以及插补对标准误差的影响。
5. 课程总结
我们简要总结课程中所涉及的加权和插补方法。
为何推荐这门课程
如果你在研究或数据分析工作中遇到缺失数据,或者想了解如何正确处理与数据质量相关的问题,这门课程将是一个很好的起点。通过理论知识与软件实现相结合的方式,学习者可以有效掌握加权和插补的技术。无论是初学者还是有经验的数据科学家,这门课程都能为你提供宝贵的知识与技能。
课程主页: https://www.coursera.org/learn/missing-data