课程主页: https://www.coursera.org/learn/sql-for-data-science
课程概述
随着数据收集的成倍增长,能够使用和处理数据的人的需求也随之增加。在商业环境中,数据科学家需要具备批判性思维能力,为决策提供洞察,以优化业务。根据SAS研究所的说法,数据科学家的角色相当于“部分数学家,部分计算机科学家,部分趋势观察者”。根据Glassdoor的数据,数据科学家被认为是美国最佳工作,年薪中位数为110,000美元,相关工作机会数以千计。
课程大纲
本课程分为多个模块,每个模块都针对SQL的不同功能进行深入讲解:
1. 开始并选择与检索数据
在这个模块中,您将能够定义SQL,并讨论SQL与其他计算机语言的不同之处。您将会了解到数据库管理员与数据科学家的角色比较,以及数据库中一对一、一对多和多对多关系之间的区别。您还将学习如何使用SELECT语句以及一些基本的语法规则。
2. 过滤、排序和计算数据
本模块引入更多的新子句和运算符,例如WHERE、BETWEEN、IN、OR、NOT、LIKE、ORDER BY和GROUP BY。您将能够利用通配符来搜索更具体或部分记录,并分析其优缺点。您将学习基本的数学运算符以及聚合函数(如AVERAGE、COUNT、MAX、MIN)来分析数据。
3. 子查询和连接
在此模块中,您将讨论子查询的优缺点以及使用情境。您将能够识别和定义几种类型的JOIN,包括笛卡尔连接、内连接、左连接、右连接、全外连接和自连接,并学习使用别名来使您的SQL代码更加清晰。
4. 修改和分析数据
您将学习如何通过连接、修剪、改变字母大小写以及使用子字符串函数来修改字符串。讨论特定的日期和时间字符串,以及如何使用CASE语句和数据管理原则等内容。本模块帮助您运用SQL的基本原则,提供数据科学背景下的应用技巧和秘籍。
总结
总之,SQL for Data Science课程为希望在数据科学领域发展的专业人士提供了一条清晰的学习路径。从基础到高级概念,该课程详细讲解了如何使用SQL进行数据分析和管理。无论您是初学者还是希望提升技能的从业者,这门课程都值得加入。
课程主页: https://www.coursera.org/learn/sql-for-data-science