随着IT存储、处理、计算和传感技术的发展,大数据已经成为一种新的生活规范。直到最近,计算机才能够捕获和分析各种领域的各种大规模数据——人、行为、信息、设备、传感器、生物信号、金融、交通工具、占星学、神经学等。几乎所有行业都准备好迎接大数据的挑战,并希望挖掘有价值的信息,以获得解决挑战的洞见。

本课程将提供基本知识,使学生能够处理这些挑战。这门学科本质上涉及许多领域。由于它的重要性和广泛的影响,新的软件和硬件工具和算法正在迅速出现。数据科学家需要跟上这种不断变化的趋势,以便能够为现实世界的挑战创造最先进的解决方案。

这门大数据分析课程首先要介绍应用概述、市场趋势和需要学习的东西。接下来,我将介绍基础平台,如Hadoop, Spark,以及其他工具,如Linked Big Data。之后,本课程将介绍几种数据存储方法以及如何上传、分发和处理它们。包括HDFS、HBase、KV存储、文档数据库、图形数据库。本课程将继续介绍在不同平台上处理分析算法的不同方法。接下来,我将介绍大数据分析中的可视化问题和移动问题。学生将掌握大数据分析的基本知识,以应对各种现实世界的挑战。

之后,课程将聚焦于讨论大型机器学习方法,这是人工智能和认知网络的基础。本课程将讨论基于不同硬件平台优化分析的几种方法,如Intel & Power芯片、GPU、FPGA等。讲座的最后将介绍大数据的未来挑战,特别是正在进行的大数据关联问题,包括图形、图形模型、时空分析、认知分析等。

https://www.ee.columbia.edu/~cylin/course/bigdata/

成为VIP会员查看完整内容
0
31

相关内容

在社会经济生活,银行、证券或保险业者从市场主体募集资金,并投资给其它市场主体的经济活动。

第一节课的重点是分析今天能够进行并行计算的典型个人计算机中的算法行为,第二节课的重点是今天能够进行分布式计算的典型公共云中的此类个人计算机集群中的算法行为。我们将从第1节中简要介绍的基本原理开始,并努力理解过去几十年来算法的重大突破。并行计算是指在一台机器上使用多个处理器和共享内存进行计算。并行计算和分布式计算虽然密切相关,但它们都提出了独特的挑战——主要是并行计算情况下的共享内存管理和分布式计算情况下的网络通信开销最小化。理解并行计算的模型和挑战是理解分布式计算的基础。课程内容反映了这一点,首先在并行环境中涵盖各种经典的、数值的和图形的算法,然后在分布式环境中涵盖相同的主题。目的是强调每个设置带来的独特挑战。

https://github.com/lamastex/scalable-data-science/blob/master/read/daosu.pdf

成为VIP会员查看完整内容
0
38

Jane Wang是DeepMind神经科学团队的一名研究科学家,研究元强化学习和受神经科学启发的人工智能代理。她的背景是物理、复杂系统、计算和认知神经科学。

Kevin Miller是DeepMind神经科学团队的研究科学家,也是伦敦大学学院的博士后。他目前正在研究如何理解mice和机器的结构化强化学习。

Adam Marblestone是施密特期货创新公司(Schmidt Futures innovation)的研究员,曾是DeepMind的研究科学家,此前他获得了生物物理学博士学位,并在一家脑机接口公司工作。

Where Neuroscience Meets AI

地址: https://sites.google.com/view/neurips-2020-tutorial-neurosci/home

大脑仍然是唯一已知的真正通用智能系统的例子。对人类和动物认知的研究已经揭示了一些关键的见解,如并行分布式处理、生物视觉和从奖赏信号中学习的想法,这些都极大影响了人工学习系统的设计。许多人工智能研究人员继续将神经科学视为灵感和洞察力的来源。一个关键的困难是,神经科学是一个广泛的、异质的研究领域,包括一系列令人困惑的子领域。在本教程中,我们将从整体上对神经科学进行广泛的概述,同时重点关注两个领域——计算认知神经科学和电路学习的神经科学——我们认为这两个领域对今天的人工智能研究人员尤其相关。最后,我们将强调几项正在进行的工作,这些工作试图将神经科学领域的见解引入人工智能,反之亦然。

概要:

  • 概述 Introduction / background (15 min)
  • 认知神经科学 Cognitive neuroscience (30 min)
  • 学习电路与机制神经科学, Learning circuits and mechanistic neuroscience (30 min)
  • 交叉最新进展 Recent advancements at the intersection (25 min)
成为VIP会员查看完整内容
0
30

本课程的教材是从机器学习的角度写的,是为那些有必要先决条件并对学习因果关系基础感兴趣的人而开设的。我尽我最大的努力整合来自许多不同领域的见解,利用因果推理,如流行病学、经济学、政治学、机器学习等。

有几个主要的主题贯穿全课程。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

成为VIP会员查看完整内容
0
60

http://www.math.arizona.edu/∼hzhang/math574.html

随着信息技术的飞速发展,在各个领域产生了大量的科学和商业数据。例如,人类基因组数据库项目已经收集了千兆字节的人类遗传密码数据。万维网提供了另一个例子,它拥有由数百万人使用的文本和多媒体信息组成的数十亿Web页面。

本课程涵盖了现代数据科学技术,包括基本的统计学习理论及其应用。将介绍各种数据挖掘方法、算法和软件工具,重点在概念和计算方面。将涵盖生物信息学、基因组学、文本挖掘、社交网络等方面的应用。

本课程着重于现代机器学习的统计分析、方法论和理论。它是为学生谁想要实践先进的机器学习工具和算法,也了解理论原理和统计性质的算法。主题包括回归、分类、聚类、降维和高维分析。

成为VIP会员查看完整内容
0
30

计算机科学正在发展,以利用新的硬件,如GPU、TPUs、CPU和大型商品集群。许多子领域,如机器学习和优化,已经调整了它们的算法来处理这样的集群。

课程主题包括分布式和并行算法: 优化、数值线性代数、机器学习、图分析、流式算法,以及其他在商用集群中难以扩展的问题。该类将重点分析程序,并使用Apache Spark和TensorFlow实现一些程序。

本课程将分为两部分: 首先,介绍并行算法的基础知识和在单多核机器上的运行时分析。其次,我们将介绍在集群机器上运行的分布式算法。

地址: http://stanford.edu/~rezab/dao/

主讲:

Reza Zadeh是斯坦福大学计算与数学工程学院的客座教授,同时也是Matroid公司的CEO。他的主要工作集中于机器学习理论与应用,分布式计算,以及离散数学。

http://stanford.edu/~rezab/

课程目录:

成为VIP会员查看完整内容
0
60
小贴士
相关VIP内容
专知会员服务
23+阅读 · 2020年12月29日
专知会员服务
38+阅读 · 2020年12月22日
专知会员服务
60+阅读 · 2020年12月12日
专知会员服务
60+阅读 · 2020年9月1日
专知会员服务
30+阅读 · 2020年8月30日
专知会员服务
55+阅读 · 2020年6月2日
专知会员服务
90+阅读 · 2020年5月22日
专知会员服务
60+阅读 · 2020年5月6日
相关论文
Monika Henzinger,Alexander Noe,Christian Schulz
0+阅读 · 1月13日
Peter Strong,Aditi Shenvi,Xuewen Yu,K. Nadia Papamichail,Henry P Wynn,Jim Q Smith
0+阅读 · 1月12日
Evaluating (weighted) dynamic treatment effects by double machine learning
Hugo Bodory,Martin Huber,Lukáš Lafférs
0+阅读 · 1月8日
Heterogeneous Graph Transformer
Ziniu Hu,Yuxiao Dong,Kuansan Wang,Yizhou Sun
14+阅读 · 2020年3月3日
Seongjun Yun,Minbyul Jeong,Raehyun Kim,Jaewoo Kang,Hyunwoo J. Kim
8+阅读 · 2020年2月5日
Yi-Lin Tuan,Yun-Nung Chen,Hung-yi Lee
3+阅读 · 2019年10月1日
Bryan Wilder,Eric Ewing,Bistra Dilkina,Milind Tambe
4+阅读 · 2019年5月31日
Naihan Li,Shujie Liu,Yanqing Liu,Sheng Zhao,Ming Liu,Ming Zhou
3+阅读 · 2018年11月13日
A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking
Henning Tjaden,Ulrich Schwanecke,Elmar Schömer,Daniel Cremers
3+阅读 · 2018年7月5日
Farzaneh Mahdisoltani,Guillaume Berger,Waseem Gharbieh,David Fleet,Roland Memisevic
7+阅读 · 2018年4月24日
Top