Deep Learning Specialization on Coursera

课程主页: https://www.coursera.org/learn/data-analysis-with-tidyverse

在现代数据科学的世界里,数据分析已经成为了一项不可或缺的技能。对于那些希望掌握数据分析但又对编程不太熟悉的学习者,Coursera的“数据分析与Tidyverse”课程提供了一个理想的入门机会。

### 课程概述
此课程是系列课程的延续,针对三种类型的学习者设计:
1. 想进行数据分析但不知道编程的人
2. 有编程基础,但不太了解R语言的人
3. 已经掌握一些R编程知识,希望深入学习Tidyverse语法的人

为了更好地理解和应用本课程内容,建议在学习本课程之前,先完成该系列的第一门课程,或至少熟悉ggplot、RMarkdown以及R语言中的基本函数编写。

### 课程大纲
**项目、Tibbles与导入数据**
在数据分析过程中,常常需要从CSV或txt文件中导入数据。本模块将教会你如何在基础R和Tidyverse的readr库中导入和解析数据。同时,你将会接触到R项目的概念,这有助于存储和组织与分析相关的数据文件。

**整理数据**
数据通常以表格形式存储,但其组织方式可能因用途而异。本模块将教你如何重组数据以生成“整洁”的数据集,其中每个变量存放在单独的列中,每个观察值存放在自己的行中,每个数值则存储在表格单元格内。

**关系数据**
数据分析通常不止涉及一个数据表,而是需要组合多个相关数据表以回答感兴趣的问题。这一模块将指导你练习如何改变变量及过滤观察结果,从关系数据中提取所需信息。

**字符串操作与正则表达式**
本模块将介绍R中的字符串操作。你将学习字符串的基本概念,包括字符串的创建、合并和子集提取。然后,你将利用正则表达式展示和查看字符串中的模式。

**分类变量与因子**
在课程的最后一模块中,你将使用Tidyverse中的forcats包来处理分类变量(即具有离散值的变量)。forcats包引入了因子这一数据对象,用于按级别对数据进行分类。你将练习创建和修改因子。

### 课程总结
“数据分析与Tidyverse”课程适合所有想要提升数据分析能力的学习者。从导入数据到数据整理,再到处理复杂的关系数据,这门课程内容丰富且实用,让你的数据分析能力得到有效提升。强烈推荐给每位希望在数据科学领域中立足的学习者!

课程主页: https://www.coursera.org/learn/data-analysis-with-tidyverse

作者 CourseEye