课程主页: https://www.coursera.org/learn/tidyverse
课程概述
在当今的数据科学领域,Tidyverse已成为一套强大的数据科学工具,彻底改变了数据科学家的工作方式。《Tidyverse简介》课程将帮助您深入了解“tidy data”(整洁数据)的简单理念,并探讨如何将非整洁数据转换为整洁数据。此外,该课程还会讲解数据科学项目生命周期及Tidyverse R包生态系统,帮助您有效开展数据科学项目。
课程大纲
Tidy Data
在讨论R如何简化tidy数据的工作之前,我们必须先了解什么是整洁数据。整洁的数据集便于操作、建模和可视化,因为该课程所讲的整洁数据原则为数据设定了通用框架和一致的规则。著名的数据科学家Hadley Wickham曾说过:“整洁数据是相似的,但每个混乱的数据集都是独特的。”采用一致的整洁数据格式可以构建更高效的工具,简化数据整理、可视化和分析流程。
从非整洁数据到整洁数据
世界上大部分数据都是非整洁的(即混乱的),这个过程将帮助您识别非整洁数据,并了解如何将其转换为整洁格式。我们将回顾一些混乱数据集中常见的问题,并学习如何标准化数据设置。
数据科学生命周期与Tidyverse生态系统
理解整洁数据在数据科学生命周期中的重要性后,我们将介绍Tidyverse及其相关包。了解这些包如何融入数据科学生命周期,将为您的数据科学项目打下良好的基础。
数据科学项目组织与工作流程
数据科学项目的组织各有不同,本部分讲解了一些常用的项目组织方式,以帮助您更好地管理项目文件和数据。
案例研究
本课程将结合真实数据进行案例研究,关注公共卫生问题。这些案例研究将贯穿整个课程,帮助您熟悉所学的概念和技能。
项目:组织数据科学新项目
在这个项目中,您将学习如何创建新项目并组织未来数据分析所需的文件。
我的推荐
总之,《Tidyverse简介》课程不仅适合初学者,也适合有一定基础的从业者。它通过清晰的教学内容和实际案例,帮助学员掌握现代数据科学的重要工具——Tidyverse。强烈推荐数据科学领域的任何人参加这个课程!
课程主页: https://www.coursera.org/learn/tidyverse