这门课程名为《数据科学应用中的统计推断与假设检验》,专注于假设检验的理论与实现,尤其是在数据科学的应用领域。通过这门课程,学生将学习如何利用假设检验从数据中做出明智的决策。
课程的首个模块是对假设检验基本概念的介绍,学生将学习什么是零假设、备择假设以及显著性水平,培养设计测试的直觉。
接下来的模块将深入探讨复合假设、功效函数与 p 值。学员将进一步理解如何通过功效函数来判断测试的有效性,并学习 p 值作为假设检验的替代方法。
在 t 检验与两样本检验的模块中,学生将对卡方和 t 分布展开学习,了解在什么情况下这些假设检验适用,并实际应用于真实数据。
此外,课程还将讨论在不符合正态分布的假设检验情境下的扩展,介绍均匀最优检验(UMP)等概念,帮助学生更好地理解假设检验的适用条件。
最后,讨论似然比检验和卡方检验模块将提供一种更为普遍化的假设检验方法,重点关注大样本性质及相关的近似检验,这对于学生在实际应用中非常有帮助。
总的来说,这门课程不仅关注理论,还强调实际应用,同时对 p 值的误用及其伦理意义给予了特别的关注。适合希望在数据科学领域建立坚实统计基础的学员。对于想在数据分析、机器学习等领域进一步发展职业生涯的人来说,这门课程的学习将极具价值。