标签归档:数据挖掘

Deep Learning Specialization on Coursera

Coursera上数据科学相关课程(公开课)汇总推荐

Coursera上的数据科学课程有很多,这里汇总一批。

1、 Introduction to Data Science Specialization

IBM公司推出的数据科学导论专项课程系列(Introduction to Data Science Specialization),这个系列包括4门子课程,涵盖数据科学简介,面向数据科学的开源工具,数据科学方法论,SQL基础,感兴趣的同学可以关注:Launch your career in Data Science。Data Science skills to prepare for a career or further advanced learning in Data Science.

1) What is Data Science?
2) Open Source tools for Data Science
3) Data Science Methodology
4) Databases and SQL for Data Science

2、Applied Data Science Specialization

IBM公司推出的 应用数据科学专项课程系列(Applied Data Science Specialization),这个系列包括4门子课程,涵盖面向数据科学的Python,Python数据可视化,Python数据分析,数据科学应用毕业项目,感兴趣的同学可以关注:Get hands-on skills for a Career in Data Science。Learn Python, analyze and visualize data. Apply your skills to data science and machine learning.

1) Python for Data Science
2) Data Visualization with Python
3) Data Analysis with Python
4) Applied Data Science Capstone

3、Applied Data Science with Python Specialization

密歇根大学的Python数据科学应用专项课程系列(Applied Data Science with Python),这个系列的目标主要是通过Python编程语言介绍数据科学的相关领域,包括应用统计学,机器学习,信息可视化,文本分析和社交网络分析等知识,并结合一些流行的Python工具包进行讲授,例如pandas, matplotlib, scikit-learn, nltk以及networkx等Python工具。感兴趣的同学可以关注:Gain new insights into your data-Learn to apply data science methods and techniques, and acquire analysis skills.

1) Introduction to Data Science in Python
2) Applied Plotting, Charting & Data Representation in Python
3) Applied Machine Learning in Python
4) Applied Text Mining in Python
5) Applied Social Network Analysis in Python

4、Data Science Specialization

约翰霍普金斯大学的数据科学专项课程系列(Data Science Specialization),这个系列课程有10门子课程,包括数据科学家的工具箱,R语言编程,数据清洗和获取,数据分析初探,可重复研究,统计推断,回归模型,机器学习实践,数据产品开发,数据科学毕业项目,感兴趣的同学可以关注: Launch Your Career in Data Science-A nine-course introduction to data science, developed and taught by leading professors.

1) The Data Scientist’s Toolbox
2) R Programming
3) Getting and Cleaning Data
4) Exploratory Data Analysis
5) Reproducible Research
6) Statistical Inference
7) Regression Models
8) Practical Machine Learning
9) Developing Data Products
10) Data Science Capstone

5、Data Science at Scale Specialization

华盛顿大学的大规模数据科学专项课程系列(Data Science at Scale ),这个系列包括3门子课程和1个毕业项目课程,包括大规模数据系统和算法,数据分析模型与方法,数据科学结果分析等,感兴趣的同学可以关注: Tackle Real Data Challenges-Master computational, statistical, and informational data science in three courses.

1) Data Manipulation at Scale: Systems and Algorithms
2) Practical Predictive Analytics: Models and Methods
3) Communicating Data Science Results
4) Data Science at Scale – Capstone Project

6、Advanced Data Science with IBM Specialization

IBM公司推出的高级数据科学专项课程系列(Advanced Data Science with IBM Specialization),这个系列包括4门子课程,涵盖数据科学基础,高级机器学习和信号处理,结合深度学习的人工智能应用等,感兴趣的同学可以关注:Expert in DataScience, Machine Learning and AI。Become an IBM-approved Expert in Data Science, Machine Learning and Artificial Intelligence.

1) Fundamentals of Scalable Data Science
2) Advanced Machine Learning and Signal Processing
3) Applied AI with DeepLearning
4) Advanced Data Science Capstone

7、Data Mining Specialization

伊利诺伊大学香槟分校的数据挖掘专项课程系列(Data Mining Specialization),这个系列包含5门子课程和1个毕业项目课程,涵盖数据可视化,信息检索,文本挖掘与分析,模式发现和聚类分析等,感兴趣的同学可以关注:Data Mining Specialization-Analyze Text, Discover Patterns, Visualize Data. Solve real-world data mining challenges.

1) Data Visualization
2) Text Retrieval and Search Engines
3) Text Mining and Analytics
4) Pattern Discovery in Data Mining
5) Cluster Analysis in Data Mining
6) Data Mining Project

8、Data Analysis and Interpretation Specialization

数据分析和解读专项课程系列(Data Analysis and Interpretation Specialization),该系列包括5门子课程,分别是数据管理和可视化,数据分析工具,回归模型,机器学习,毕业项目,感兴趣的同学可以关注:Learn Data Science Fundamentals-Drive real world impact with a four-course introduction to data science.

1) Data Management and Visualization
2) Data Analysis Tools
3) Regression Modeling in Practice
4) Machine Learning for Data Analysis
5) Data Analysis and Interpretation Capstone

9、Executive Data Science Specialization

可管理的数据科学专项课程系列(Executive Data Science Specialization),这个系列包含4门子课程和1门毕业项目课程,涵盖数据科学速成,数据科学小组建设,数据分析管理,现实生活中的数据科学等,感兴趣的同学可以关注:Be The Leader Your Data Team Needs-Learn to lead a data science team that generates first-rate analyses in four courses.

1)A Crash Course in Data Science
2)Building a Data Science Team
3)Managing Data Analysis
4)Data Science in Real Life
5)Executive Data Science Capstone

10、其他相关的数据科学课程

1) Data Science Math Skills
2) Data Science Ethics
3) How to Win a Data Science Competition: Learn from Top Kagglers

注:原创文章,转载请注明出处“课程图谱博客”:http://blog.coursegraph.com

本文链接地址:http://blog.coursegraph.com/coursera上数据科学相关课程数据科学公开课汇总推荐 http://blog.coursegraph.com/?p=851

Coursera课程下载和存档计划三:机器学习 & 自然语言处理 & 推荐系统 & 数据挖掘相关公开课

周末对之前保存和下载的Coursera课程做了一下整理和归类,先送出机器学习、自然语言处理、推荐系统和数据挖掘相关的14门课程资源。这些公开课资源很多来自于之前课程图谱群内朋友的或者微博上的朋友的分享,这里做了一些补充,主要针对Coursera旧课程平台的课程进行备份和分享,对于一些已经迁移至新课程平台的课程,希望大家直接去Coursra新课程平台上去上课,这样会有更好的学习体验。最后特别说明的是,课程网盘资源仅供个人备份学习使用。

关于“Coursera课程下载和存档计划”,请参考:

  1. Coursera Downloader 下载工具
  2. Coursera课程速查表

以下是按几个类别整理的相关课程资源,相关信息我们也会同步到“Coursera Archive”项目上去:

机器学习相关课程:

1、斯坦福大学 Andrew Ng 机器学习 (Machine Learning)

该课程已经在Coursera新的课程平台上发布(https://www.coursera.org/learn/machine-learning),在线的课程资源依然会得到保留,优先推荐在线学习,可以做练习,可以提交作业,这里分享的百度网盘资源包含两个版本,来自于之前大家的分享:

链接: https://pan.baidu.com/s/1bBVtIQ 密码: 26hc

2、华盛顿大学 Pedro Domingos 机器学习 (Machine Learning)

该课程一直没有开课,但是可以preview,视频量很足,类容丰富,用Coursera Downloader下载后大约5G,是目前所有课程下载中占用空间最大的。

链接: https://pan.baidu.com/s/1o8meCps 密码: tekb

3、台湾大学 林軒田 机器学习基石 (Machine Learning Foundations)

该课程在课程图谱上的评价很高,10条评价全是五星,而且评论都很精彩。据说林老师现在创业去了,这门课说不定也会成为绝版,赶紧收藏吧,有三个版本,来自于之前大家的分享或者网上的公开资源。

链接: http://pan.baidu.com/s/1hsmAsNq 密码: kxfj

4、台湾大学 林軒田 机器学习技法(Machine Learning Techniques)

机器学习基石 (Machine Learning Foundations)课程姊妹篇,或者下部,难度依然很高,所以货真价实,值得收藏。

链接: http://pan.baidu.com/s/1bpHSAPD 密码: abye

5、多伦多大学 Geoffrey Hinton 面向机器学习的神经网络(Neural Networks for Machine Learning)

Geoffrey Hinton大神在Coursera上的这门课程只在2012年开过一轮,这次应该不会进行迁移了:

“Deep learning必修课”

“宗派大师+开拓者直接讲课,秒杀一切二流子”

看看上面的点评,对深度学习感兴趣的同学赶紧保存,本次分享包含两个版本,均为之前大家的分享:

链接: https://pan.baidu.com/s/1sl0R7PV 密码: k4ui

6、斯坦福大学 Daphne Koller 概率图模型公开课(Probabilistic Graphical Models)

这次应该也不会迁移了,想当年多少大神在Coursera上开课。。。本次分享有两个版本,来自于之前大家的分享和网络上的可查资源:

链接: https://pan.baidu.com/s/1hr4X2YS 密码: n5j9


自然语言处理相关课程

7、哥伦比亚大学 Michael Collins 自然语言处理公开课(Natural Language Processing)

NLP大神的课程,必须备份,来自之前一个朋友的分享:
链接: http://pan.baidu.com/s/1hsbKYK8 密码: ines

Update: 链接: https://pan.baidu.com/s/1c2JpM28 密码: 9dwx

8、斯坦福大学 Dan Jurafsky和Christopher Manning 自然语言处理(Natural Language Processing)

这门课程的授课老师是斯坦福教授Dan Jurafsky和Christopher Manning,两位都是NLP领域的大大牛,其他不说,仅仅是他们写的书应该是很多NLPer的入门书:前者写了《Speech and Language Processing》,中文译名《自然语言处理综论》,后者写了《Foundations of Statistical Natural Language Processing》,中文译名《统计自然语言处理基础》,这两本几乎是NLPer的入门必读书籍。

用coursera-dl下载了一份并上传到百度网盘备份,需要的同学尽快保存:

链接: http://pan.baidu.com/s/1jHKfXQm 密码: s6hx

Update: http://pan.baidu.com/s/1nvbEOFf 密码: pjzd

9、密歇根大学 Dragomir R. Radev Introduction to Natural Language Processing(自然语言处理导论)

这门课程了解不是太多,下载了一份作为备份:

链接: http://pan.baidu.com/s/1nu5MFVj 密码: 3t3h

10、伊利诺伊大学厄巴纳香槟分校 翟成祥(ChengXiang Zhai) Text Mining and Analytics(文本挖掘与分析)

这门课程已经切换到Coursera新课程平台:https://www.coursera.org/learn/text-mining ,最新一轮课程将于2016年7月11号开课,推荐感兴趣的同学直接在线学习,体验MOOC平台的诸多好处。

推荐系统相关课程:

11、明尼苏达大学 Joseph Konstan 和 Michael D Ekstrand Introduction to Recommender Systems(推荐系统导论)

这门课程已经切换到Coursera新课程平台:https://www.coursera.org/learn/recommender-systems ,最新一轮课程刚刚于2016年6月13号开课,推荐感兴趣的同学直接加入学习。以下提供一个网盘资源,是一个全部课程的打包压缩文件:

链接: http://pan.baidu.com/s/1pLy7uvL 密码: ui1u

数据挖掘相关课程

12、斯坦福大学 Jeff Ullman & Anand Rajaraman & Jure Leskovec Mining Massive Datasets

这门课程的授课老师之一是巨牛Jeff Ullman,他是计算机领域鼎鼎大名的“龙书”《编译原理》及数据库领域权威指南《数据库系统实现》这两本书的作者之一,谷歌创始人Sergey Brin亦是他的学生之一。该课程对应一个官方主页:http://www.mmds.org/,提供课程和书籍的相关资源,全部开放。所对应的同名书籍中文译名为《大数据 互联网大规模数据挖掘与分布式处理》,由王斌老师翻译,已出第二版。网盘资源来自于大家的分享,包括两个版本和一个英文版电子书籍:

链接: http://pan.baidu.com/s/1c81pRC 密码: e25n

13、伊利诺伊大学厄巴纳-香槟分校 Jiawei Han Pattern Discovery in Data Mining(数据挖掘中的模式发现)

授课老师 Jiawei Han 是数据挖掘领域国际知名学者,这门课程目前已经迁移到Coursera新的课程平台 https://www.coursera.org/learn/data-patterns ,新一轮课程将于8月底开课,感兴趣的同学可以关注。

14、伊利诺伊大学厄巴纳-香槟分校 Jiawei Han Cluster Analysis in Data Mining(数据挖掘中的聚类分析)

同上一门课程构成姊妹篇,目前也已经迁移到Coursera新的课程平台 https://www.coursera.org/learn/cluster-analysis ,新一轮课程将于10月初开课,感兴趣的同学可以关注。

注:原创文章,转载请注明出处“课程图谱博客”:http://blog.coursegraph.com

本文链接地址:http://blog.coursegraph.com/coursera课程下载和存档计划三

数据分析公开课汇总

数据分析是如今非常热门的话题之一,课程图谱为此简单整理一下目前(2014年初)在MOOC平台上有关数据挖掘方面的公开课程。
Coursera

1.  Johns Hopkins University的Data Analysis 该课通过R语言讲授数据分析的技巧:

@Cloga在路上:很好的一门课程,用R为工具讲了数据分析挖掘的一些算法和实例。

2. University of Washington的Computational Methods for Data Analysis 该课为课堂录像,通过MOOC的形式进行组织,讲师Nathan Kutz讲课生动、幽默,但是该课不足之处是课程不提供证书激励且几乎没有课程工作人员参与讨论,属于自助性质的课程。

3. University of Washington的Scientific Computing:科学计算是很多工程应用领域的基础课程,该课的讲师同样为Nathan Kutz,课程形式与上一门Computational Methods for Data Analysis基本一致。

4. University of Toronto的Statistics: Making Sense of Data

@Mavlarn008:就像这门课的标题“making sense”一样,这门课最好的地方就是让你对统计有”感觉”。虽然讲的比较简单,但是对于理解这些概念非常有用。 最后那个大胡子还自弹自唱一首他自创的有关这门课的歌,也很有意思。

5. University of Washington的Introduction to Data Science

@Cloga在路上:很好的一门课,尤其对于我这种初学者,老师讲的面很广,涉及了数据科学的很多方面。
不足之处是课程内容过多有些内容讲的很匆忙,比如数据可视化这个部分,大家普遍反馈讲的有点水,Graph那部分也有点水。
比较好玩的是,课程结束后Bill好像有些事情,拖了一段时间才给出分数,大家在课程论坛上各种吐槽,无比欢乐。

@伟伟酱说:正如老师开始所讲的,这门课的目的只是让你成为advanced beginer,课程内容涵盖了数据库(SQL,NoSQL),MapReduce,基本的数值分析,机器学习,数据可视化。类似于另外一门课Web intelligence and big data,两者都应该算是入门型课程,学生想要深入学习的话可以选择其他专门的课程。
有人认为老师讲课枯燥,你总不能指望每个老师把数学课讲的有历史课那么有趣吧~

@钛合金蛙眼: 希望和失望并存。。。课程内容结构很好,讲的不好;作业很赞,对有一定基础的人不难,但入门的同学可能还是有困难。如果只是想粗浅了解课程各个topic的,跟着做作业就不错,想深入还需自学

6. Columbia University的Big Data in Education:该课讨论的是将数据分析的技巧运用于教育领域

7. Johns Hopkins University的Computing for Data Analysis

@宋鑫要学习:想入门R语言的可以听听。我自己之前有看过一些R的入门书籍,但是总感觉云里雾里,这门课让我感觉自己摸着点门道

@Puriney:这门课更确切说确实是R语言指南,很多实用并且系统地把R用法娓娓道来,没有啥算法,因此可能有人觉得不象一门综合大学的课程而更象蓝翔技校般的技能课。我想跟当时课程开课有一定关系,当时我记得是这门4周课时的课(很精简了)先开(Roger Peng主讲),结束之后马上接着便是Roger Peng的好基友Jeff Leek (他们都是http://simplystatistics.org/博客的共同博主)讲的Data Analysis。Jeff的这门课就更加复杂,作业里有更多计算成分在,就不那么“技校”了。 p.s. 这是我唯一一门上完不那么费脑力的课(相比那些算法的课)。Jeff的这门我没有坚持到底,当时我很讨厌“互相批改”的评分制度(如果没记错)

@要有光LTBL:R讲的挺好的,一直在用但是知识体系并不是很系统。这门课还是讲得不错的。。。

@wzyer:这门课就应该叫作R使用手册。全是R的语法与应用,有些让我失望。语法什么的太琐碎,很容易遗忘,放到课上讲太多语法个人以为不妥。

 

8. Stanford University的StatLearning: Statistical Learning:名著The Elements of Statistical Learning: Data Mining, Inference, and Prediction(ESL)的作者Trevor Hastie和Rob Tibshirani开设的课程,本课的配套教材An Introduction to Statistical Learning: with Applications in R在美国亚马逊上获得了极高的评价,在课程中该教材将会免费对外开放

9.Duke University的Data Analysis and Statistical Inference:该课将会由R语言讲授统计学和数据分析方面的内容,欢迎关注

Udacity
Udacity近期与企业界合作推出了一些数据分析领域的课程,课程内容本身对外公开免费,但如果需要获得证书以及专门的在线辅导的话则需要支付一定的费用。
1. Introduction to Hadoop and MapReduce:

@ziyoudefeng: 这门课程太简单了,google搜索 mapreduce PPT 出来的这些PPT,看上几个也都抵上这三节课了。不过,总共也就3节课,听听也无妨。讲的内容很初级,小白用户可以网上的讲义加视频一起学习!

2. Introduction to Data Science

3. Data Wrangling with MongoDB

4. Exploratory Data Analysis

注:原创文章,转载请注明出处“课程图谱博客”:blog.coursegraph.com

本文链接:http://blog.coursegraph.com/数据分析公开课汇总