​【导读】本文为大家带来了一份斯坦福大学的最新课程CS246——大数据挖掘Mining Massive Data Sets,主讲人是斯坦福大牛Jure Leskovec,他是斯坦福大学计算机学院的副教授,也是图表示学习方法 node2vec 和 GraphSAGE 作者之一。

本课程将讨论用于分析大数据的数据挖掘和机器学习算法。重点将放在MapReduce和Spark作为创建并行算法的工具,这些算法可以处理非常大的数据。

原始链接: http://web.stanford.edu/class/cs246/

1 课程介绍

主题包括: 频繁项集和关联规则,高维数据中的近邻搜索,局部敏感哈希(LSH),降维,推荐系统,聚类,链接分析,大规模监督机器学习,数据流,挖掘结构化数据的Web, Web广告。

2 课程目录

  • 01:课程介绍和MapReduce and Spark(Introduction; MapReduce and Spark)
  • 02:频繁项集挖掘(Frequent Itemsets Mining)
  • 03:局部敏感哈希(Locality-Sensitive Hashing I)
  • 04:局部敏感哈希(Locality-Sensitive Hashing II)
  • 05:聚类(Clustering)
  • 06:推荐系统(Recommender Systems I)
  • 07:推荐系统(Recommender Systems II)
  • 08:PageRank(PageRank)
  • 09:链接欺诈与社交网络导论(Link Spam and Introduction to Social Networks)
  • 10:社区检测(Community Detection in Graphs)
  • 11:图表示学习(Graph Representation Learning)
  • 12:大规模机器学习(Large-Scale Machine Learning I)
  • 13:数据流挖掘(Mining Data Streams I)
  • 14:计算广告(Computational Advertising)
  • 15:通过实验学习(Learning through Experimentation)
  • 16:优化子模块功能(Optimizing Submodular Functions)
成为VIP会员查看完整内容
60

相关内容

【斯坦福CS224W】知识图谱推理,84页ppt
专知会员服务
116+阅读 · 2021年2月19日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
专知会员服务
41+阅读 · 2020年12月18日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
【课程】浙大陈华钧教授《知识图谱导论》课程系列PPT
专知会员服务
164+阅读 · 2019年10月29日
麻省理工2019年深度学习导论课程全套PPT
专知
14+阅读 · 2019年2月15日
资源|斯坦福课程:深度学习理论!
全球人工智能
16+阅读 · 2017年11月9日
Arxiv
34+阅读 · 2019年11月7日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
9+阅读 · 2018年3月23日
VIP会员
相关VIP内容
【斯坦福CS224W】知识图谱推理,84页ppt
专知会员服务
116+阅读 · 2021年2月19日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
专知会员服务
41+阅读 · 2020年12月18日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
【课程】浙大陈华钧教授《知识图谱导论》课程系列PPT
专知会员服务
164+阅读 · 2019年10月29日
微信扫码咨询专知VIP会员