Deep Learning Specialization on Coursera

课程主页: https://www.coursera.org/learn/batch-data-pipelines-gcp-es

在大数据时代,数据管道的构建变得尤为重要。Coursera的《在GCP上构建批处理数据管道(西班牙语)》课程正是为了帮助学习者掌握数据处理的不同范式而设计的。在本课程中,学员们将了解到提取与加载(EL)、提取、加载与转换(ELT)以及提取、转换与加载(ETL)等多种数据处理方式。

课程的第一部分介绍了数据管道构建的基础知识,帮助学员理解在不同场景下应选择何种范式。接下来的模块则深入探讨了在Google Cloud Platform(GCP)上构建数据管道时所需的各种技术。

特别是在“执行Spark在Dataproc”模块中,学员们将学习如何在Dataproc上运行Hadoop并使用Cloud Storage,此外还会介绍如何优化Dataproc作业。

在“无服务器数据处理与Dataflow”模块中,讲师将指导学员使用Dataflow构建数据处理管道,这一部分展示了GCP的强大之处。

课程的后期内容侧重于使用Cloud Data Fusion和Cloud Composer来管理数据管道,为学员提供了一整套的工具使用指南。

总的来说,这个课程结构清晰,内容丰富,适合希望在GCP上创建和管理批处理数据管道的学习者。无论是初学者还是有经验的专业人士,都能在这里找到适合自己的内容。

课程主页: https://www.coursera.org/learn/batch-data-pipelines-gcp-es

作者 CourseEye