课程主页: https://www.coursera.org/learn/cloud-applications-part2
随着信息技术的高速发展,云计算和大数据已成为当代科技领域最为热议的话题之一。Coursera 提供的《云计算应用,第2部分:大数据与云中的应用》课程,使学生能够全面了解这两个领域的交集。在这门课程中,您将深入探索如何利用云技术处理庞大的数据量,包括静态数据和实时数据流。
课程开始时,会有一个课程导览,帮助您熟悉课程内容及学习环境,并掌握必要的技术技能。课程分为几个模块,每个模块都有其独特的主题和学习目标。
**模块1:Spark、Hortonworks、HDFS、CAP** 这一部分让学生了解大数据应用的基础框架 Apache Spark。此外,还会介绍一些大数据发行版、HDFS 文件系统以及基于 MapReduce 编程范式的批处理大数据处理。
**模块2:大规模数据存储** 课中讲解了分布式系统中存储大数据时所面临的挑战,并讨论如何使用内存键值存储系统、NoSQL 分布式数据库和分布式发布/订阅队列来提高存储效率。
**模块3:流处理系统** 本模块突出了实时流处理系统,如 Apache Storm 和 Apache Spark Streaming,使学生了解如何处理快速数据,并讨论 Lambda 和 Kappa 架构的差异。
**模块4:图处理与机器学习** 此部分集中在大数据的应用场景上,讨论如何对大规模图(如网页图)进行信息处理,以及如何利用大量数据训练机器学习模型,包括聚类算法和频繁模式挖掘。课程还涵盖了深度学习的相关知识,探讨如何用大数据训练神经网络以获取有效结果。
总体而言,这门课程不仅涵盖了从基础概念到实际应用的各个方面,还结合了当前市场上广泛使用的工具和技术,适合想要深入了解大数据和云计算应用的学员。无论您是初学者还是有一定基础的学习者,都能从中受益颇丰。通过这门课程,您将能够更好地掌握现代大数据环境下的关键技术,并为未来的职业发展打下坚实基础。
课程主页: https://www.coursera.org/learn/cloud-applications-part2