课程主页: https://www.coursera.org/learn/big-data-emerging-technologies
在现代社会中,大数据的影响力无处不在。每当我们使用Google搜索、在Facebook、Twitter或Instagram上互动,或在Amazon上购买推荐商品时,我们都在使用大数据系统。《大数据新兴技术》这门课程正是为满足当今商业和科技需求而设计的,帮助学生深入了解大数据及其应用。
课程的第一模块“**大数据排名与产品**”介绍了大数据硬件、软件及专业服务的市场份额及其关系。通过了解行业领先的大数据产品及其不同特性,我们能够洞察未来企业、学校和政府是如何受到大数据技术影响的。
第二模块“**大数据与Hadoop**”深入探讨了Hadoop的特性及其运作,讲解了MapReduce和HDFS(Hadoop分布式文件系统)的基本概念。
第三模块“**Spark**”则专注于当今最受欢迎的大数据技术Spark,讲解了其数据分析特点及如何利用RDD(弹性分布式数据集)进行数据处理。
后续模块涵盖了“**Spark ML与流处理**”和“**Storm**”,介绍了机器学习及实时数据流的特性,适用于实时分析和计算应用。
最后一模块“**IBM SPSS统计项目**”使学生能够实际操作IBM SPSS统计分析系统,积累实战经验。在这个项目中,学生将通过分析数据集中的关系,掌握如何运用IBM SPSS进行数据分析并生成图表。
总之,课程内容全面、实用,适合希望深入了解大数据技术的学生或专业人士。无论是企业应用还是学术研究,这门课程都能为你提供坚实的理论基础与实践技能。
课程主页: https://www.coursera.org/learn/big-data-emerging-technologies