课程主页: https://www.coursera.org/learn/cloud-applications-part2
大家好,今天我想和大家分享一门非常优秀的在线课程——《云计算应用(第二部分):云中的大数据与应用》。这门课程是一个两部分系列课程的第二部分,旨在为您提供关于云计算和大数据的全面视角。无论您是刚接触云计算的新手,还是希望加深知识的专业人士,这门课程都将为您带来深刻的见解。
**课程概述**
在这门课程中,您将深入了解云如何开启对大量数据的分析,无论是静态数据还是以高速度流动的数据,这些数据包含了各种各样的信息。云应用与数据分析的结合正在改变我们处理和分析数据的方式。
**课程大纲**
1. **课程导向**
课程的开头部分将帮助您熟悉课程、同学以及我们的学习环境。此外,还将帮助您获得本课程所需的技术技能。
2. **模块一:Spark、Hortonworks、HDFS、CAP**
在这一模块中,您将了解大数据应用的世界。我们将介绍Apache Spark,这是一个在整个课程中多任务使用的常见框架。同时还会介绍一些大数据发行版包、HDFS文件系统以及基于批处理的大数据处理(MapReduce编程范式)。
3. **模块二:大规模数据存储**
本模块您将学习大规模数据存储技术和框架。我们将探讨在分布式系统中存储大数据的挑战,并讨论内存中的键值存储系统、NoSQL分布式数据库和分布式发布/订阅队列。
4. **模块三:流处理系统**
该模块将介绍实时流处理系统,又称为快速数据。我们会深入探讨Apache Storm、Apache Spark Streaming及Lambda和Kappa架构,并将这些技术在流处理生态系统中进行对比。
5. **模块四:图处理与机器学习**
在这一模块中,我们将讨论大数据应用,尤其是图处理(例如网络图)和机器学习(如聚类算法和频繁模式挖掘)的应用。我们也会介绍深度学习,在那里大数据集被用于有效训练神经网络模型。
总之,《云计算应用(第二部分):云中的大数据与应用》不仅会带给您丰富的理论知识,还有助于您实际应用这些知识。如果您希望在大数据与云计算领域深入发展,这门课程绝对值得推荐!
课程主页: https://www.coursera.org/learn/cloud-applications-part2