因果性是现在机器学习关注的焦点之一。伦敦大学学院和牛津大学的学者发布了《因果机器学习》综述,非常值得关注!

因果机器学习(CausalML)是将数据生成过程形式化为结构因果模型(SCM)的机器学习方法的总称。这使得人们可以对这一过程的变化的影响(即干预)和事后会发生什么(即反事实)进行推理。根据他们所解决的问题,我们将CausalML中的工作分为五组:(1)因果监督学习,(2) 因果生成模型,(3) 因果解释,(4) 因果公平,(5) 因果强化学习。对每一类方法进行了系统的比较,并指出了有待解决的问题。此外,我们回顾了特定模式在计算机视觉、自然语言处理和图形表示学习中的应用。最后,我们提供了因果基准的概述,并对这一新兴领域的状态进行了批判性的讨论,包括对未来工作的建议。

引言

机器学习(ML)技术今天擅长在独立和同分布(i.i.d)数据中寻找关联。一些基本原则,包括经验风险最小化、反向传播和架构设计中的归纳偏差,已经为解决计算机视觉、自然语言处理、图表示学习和强化学习等领域的问题带来了巨大的进步。然而,在将这些模型部署到现实环境中时,出现了新的挑战。这些挑战包括: (1) 当数据分布转移[1]时泛化性能大幅下降,(2) 生成模型[2]样本缺乏细粒度控制,(3) 有偏见的预测强化了某些子种群的不公平歧视[3,4],(4) 可解释性[5]的概念过于抽象和问题独立,(5)强化学习方法对真实世界问题[6]的不稳定转换。

许多工作认为,这些问题的部分原因在于现代ML系统缺乏因果形式主义[7,8,9,10,11]。随后,研究社区对因果机器学习(CausalML)的兴趣激增,这是利用关于被建模系统的因果知识的方法本调查涵盖了因果关系如何被用来解决开放式ML问题。简而言之,因果推理提供了一种语言,通过结构因果模型(SCMs)[12]将关于数据生成过程(DGP)的结构知识形式化。使用SCM,我们可以估计在对数据生成过程进行更改(称为干预)后,数据会发生什么变化。更进一步,它们还允许我们在事后模拟变化的后果,同时考虑实际发生的情况(称为反事实)。我们将在第2章中更详细地介绍这些概念,假设没有因果关系的先验知识。

尽管在设计各种类型的CausalML算法方面做了大量的工作,但仍然缺乏对其问题和方法论的明确分类。我们认为,部分原因在于CausalML通常涉及对大部分ML不熟悉的数据的假设,这些假设在不同的问题设置之间联系起来通常很棘手,这使得很难衡量进展和适用性。这些问题是本次综述的动机。

**1. 我们对完全独立的因果关系中的关键概念进行了简单的介绍(第2章)。**我们不假设对因果关系有任何先验知识。在整个过程中,我们给出了如何应用这些概念来帮助进一步的地面直觉的例子。

2. 我们将现有的CausalML工作分类为因果监督学习(第3章)、因果生成模型(第4章)、因果解释(第5章)、因果公平(第6章)、因果强化学习(第7章)。对于每个问题类,我们比较现有的方法,并指出未来工作的途径。

3.我们回顾了特定模式在计算机视觉、自然语言处理和图表示学习中的应用(第8章),以及因果基准(第9章)。

4. 我们讨论了好的、坏的和丑陋的:我们关于与非因果ML方法相比,因果ML可以给我们带来哪些好处的观点(好的),人们必须为这些方法付出什么代价(坏的),以及我们警告从业者要防范哪些风险(丑陋的)(第10章)

结论发现**

  • 因果推理(第二章),与统计或概率推理相反,允许我们对介入和反事实的估计进行推理。
  • 因果监督学习(第3章)通过学习不变特征或机制来改进预测泛化,两者都旨在消除模型对虚假关联的依赖。未来的工作应该研究学习不变性的目标基准测试、对抗鲁棒性的联系以及元学习,以及额外监督信号的潜在利用。
  • 因果生成模型(第4章)支持从介入的或反事实的分布中采样,自然地分别执行原则可控的生成或样本编辑任务。所有现有的方法都学习结构作业;一些人还从数据中推断出因果结构。对于不同的应用程序应该考虑什么层次的抽象,如何将分配学习扩展到更大的图,以及反事实生成的数据增强何时有效(何时无效),这些都有待探索。
  • 因果解释(第5章)解释模型预测,同时解释模型机制或数据生成过程的因果结构。方法可以分为特征归因(量化输入特征的因果影响)和对比解释(表示获得期望结果的改变实例)。到目前为止,还不清楚如何最好地统一这两类方法,扩大解释范围,使它们对分布转移具有鲁棒性,对攻击者安全和私有,以及如何规避不可避免的对追索敏感性的鲁棒性权衡。
  • 因果公平(第6章)为评估模型的公平性以及减轻潜在数据因果关系的有害差异的标准铺平了道路。该标准依赖于反事实或介入性分布。未来的工作应该阐明在标准预测设置之外的平等、公平、较弱的可观察性假设(例如隐藏的混淆)以及对社会类别的干预主义观点的有效性。
  • 因果强化学习(第7章)描述了考虑决策环境的显性因果结构的RL方法。我们将这些方法分为7类,并观察到它们比非因果方法的好处包括反发现(导致更好的泛化)、内在奖励和数据效率。开放的问题表明,一些形式主义可能是统一的,离线数据的反发现在离线RL部分很大程度上没有解决,而代理根据反事实做出的决定可能会提供进一步的好处。
  • 模态-应用:我们回顾了之前介绍的和模态特定原则如何提供机会来改善计算机视觉、自然语言处理和图形表示学习设置。
成为VIP会员查看完整内容
96
0

https://nostarch.com/math-deep-learning

深度学习无处不在,这使得AI的强大驱动力成为更多STEM专业人士需要了解的东西。学习使用哪个库命令是一回事,但要真正理解这一原则,您需要掌握使之正确的数学概念。本书将为您提供概率论、统计学、线性代数和微分学等主题的工作知识,这些是使深度学习易于理解的基本数学知识,也是成功练习深度学习的关键。 这四个子领域中的每一个都与Python代码和实际操作的示例相关联,这些示例弥合了纯数学及其在深度学习中的应用之间的差距。章节建立在彼此的基础上,基本的主题,如贝叶斯定理,然后是更高级的概念,如使用向量、矩阵和函数的导数训练神经网络。在探索和实现深度学习算法时,您将最终使用所有这些数学知识,包括反向传播和梯度下降——这些基本算法使AI革命成为可能。 你将学习:

  • 概率规则,概率分布,贝叶斯概率
  • 使用统计数据来理解数据集和评估模型
  • 如何操作向量和矩阵,并利用它们在神经网络中移动数据
  • 如何用线性代数实现主成分分析和奇异值分解
  • 如何应用改进版本的梯度下降,如RMSprop, Adagrad和Adadelta
  • 一旦你通过AI编程的镜头理解了本书中呈现的核心数学概念,你就会有基础的知识来轻松跟随和使用深度学习。

目录内容:

Introduction Chapter 1: Setting the Stage Chapter 2: Probability Chapter 3: More Probability Chapter 4: Statistics Chapter 5: Linear Algebra Chapter 6: More Linear Algebra Chapter 7: Differential Calculus Chapter 8: Matrix Calculus Chapter 9: Data Flow in Neural Networks Chapter 10: Backpropagation Chapter 11: Gradient Descent Appendix: Going Further View the Copyright page

View the detailed Table of Contents

View the Index

成为VIP会员查看完整内容
87
0

在当今世界,深度学习源代码和大量开放获取的地理空间图像很容易获得和访问。然而,大多数人缺少利用这一资源的教育工具。使用开源软件对遥感图像进行深度学习是第一本介绍使用免费开源工具处理真实世界遥感图像的深度学习技术的实用书籍。本书中详细介绍的方法是通用的,可以适用于遥感图像处理的许多不同应用,包括土地覆盖测绘、林业、城市研究、灾害测绘、图像恢复等。在头脑中与从业者和学生一起写,这本书帮助把现有工具和数据的理论和实际使用联系在一起,在遥感图像和数据上应用深度学习技术。

  • 第一本解释如何使用开源软件(QGIS, Orfeo ToolBox, TensorFlow)将深度学习技术应用于公共的、免费的数据(Spot-7和Sentinel-2图像,OpenStreetMap向量数据)的书。

  • 提出了适合于大规模处理和GIS应用的真实世界图像和数据的方法

  • 介绍了可应用于遥感世界的最先进的深度学习架构家族,主要用于土地覆盖制图,但也用于通用方法(如图像恢复)

  • 适合深度学习初学者和具有一些GIS知识的读者。学习实际技能不需要编码知识。

  • 包括深度学习技术通过许多步骤遥感数据处理练习。

成为VIP会员查看完整内容
59
0

博弈论推理遍及经济理论,并广泛应用于其他社会和行为科学。Martin J. Osborne的《博弈论导论》介绍了博弈论的主要原则,并展示了如何用它们来理解经济、社会、政治和生物现象。这本书以一种通俗易懂的方式介绍了理论背后的主要思想,而不是他们的数学表达。所有的概念都被精确地定义,并且逻辑推理贯穿始终。这本书要求读者理解基本的数学知识,但不需要经济学、政治学或其他社会或行为科学的具体知识。

包括战略博弈、完全信息广义博弈和联盟博弈的基本概念;较高级的贝叶斯对策和不完全信息的广泛对策;以及重复博弈、议价理论、进化均衡、合理化和最大化的主题。这本书提供了各种各样的插图,从社会和行为科学和280多个练习。每个主题都有突出理论点的例子和说明如何使用理论的例子。尽可能简单地解释博弈论的关键概念,同时保持完整的精度,博弈论导论是博弈论本科和入门研究生课程的理想选择。

https://mathematicalolympiads.files.wordpress.com/2012/08/martin_j-_osborne-an_introduction_to_game_theory-oxford_university_press_usa2003.pdf

https://cgi.csc.liv.ac.uk/~spirakis/COMP323-Fall2017/week01.pdf

成为VIP会员查看完整内容
60
0

在过去的十年里,公众对现代社会复杂的“连通性”越来越感兴趣。这种联系体现在许多方面:因特网和网络的迅速发展,全球交流的便利,新闻和信息以及流行病和金融危机以惊人的速度和强度在世界各地传播的能力。这些现象涉及到网络、激励和群体的聚集行为;它们基于我们之间的联系,以及我们的每一个决定对其他人的结果产生微妙影响的方式。

这本关于网络新科学的介绍性书籍采用了跨学科的方法,使用经济学、社会学、计算、信息科学和应用数学来解决关于连接我们的联系的基本问题,以及我们的决定可以对他人产生影响的方式。

本书分为7个部分,每个部分3 - 4章。第一部分和第二部分讨论了支撑我们对网络和行为的调查的两个主要理论:图论,研究网络结构,和博弈论,在人们的决定影响彼此结果的环境中,形成行为模型。第三部分整合了这些思路,分析了市场的网络结构,以及这种网络中的权力概念。第四部分追求不同的集成,讨论了作为信息网络的万维网,Web搜索的问题,以及目前处于搜索行业核心的市场的发展。第五和第六部分研究了在网络和群体内部发生的一些基本过程的动态,包括人们受他人决定影响的方式。第五部分在总体尺度上追求这个主题,在那里我们模拟了个体和整体人口之间的互动。第六部分继续在更细粒度的网络结构层面进行分析,从影响力问题开始,接着讨论搜索过程和流行病的动态。最后,第七部分考虑了我们如何将基本的社会制度——包括市场、投票制度和产权——解释为有效地塑造我们一直在研究的一些现象的机制。

成为VIP会员查看完整内容
48
0

OpenIntro Statistics涵盖了统计的第一门课程,提供了应用统计的严格介绍,清晰,简洁,可访问。这本书是为本科水平而写的,但它在高中和研究生课程中也很受欢迎。我们希望读者能从本书中获得三个观点,除此之外,还能形成统计思维和方法的基础。

  • 统计学是一个具有广泛实际应用的应用领域。
  • 你不必成为数学大师,也能从真实有趣的数据中学习。
  • 数据是混乱的,统计工具是不完美的。但是,当你了解这些工具的优点和缺点时,你就可以用它们来了解这个世界。

本书各章节内容如下:

1. 介绍数据。数据结构、变量和基本的数据收集技术

2. 总结数据。数据摘要、图形和随机化

3.概率。概率的基本原理。

4. 随机变量的分布。正态分布和其他关键分布

5. 推理的基础。在估计总体比例的情况下,统计推断的一般思想。

6. 分类数据的推理。使用正态分布和卡方分布推断比例和表。

7. 对数值数据的推断。使用t分布推断一个或两个样本平均值,比较两组的统计力量,也使用方差分析的许多平均值的比较。

8. 线性回归概论。回归一个预测变量的数值结果。本章的大部分内容可以在第1章之后进行介绍。

9. 多元和逻辑回归。使用多种预测器对数值和分类数据进行回归。

成为VIP会员查看完整内容
48
0

人工智能将改变医疗健康的方方面面,包括我们管理个人健康的方式,从客户体验和临床护理到降低医疗保健成本。这本实用的书是第一本描述AI可以帮助解决有害的医疗保健问题的当前和未来用例的书。

https://www.oreilly.com/library/view/ai-first-healthcare/9781492063148/

Kerrie Holley和Siupo Becker提供指导,帮助信息学和医疗保健领导为医疗保健创建AI战略和实施计划。有了这本书,业务利益相关者和实践者将能够建立知识、路线图和信心来支持他们组织中的人工智能——而不会陷入算法或开源框架的泥潭。

由AI技术专家和利用AI解决医疗保健最困难的挑战的医生共同撰写的这本书涵盖: 人工智能的神话和现实,现在和未来 以人为本的人工智能:它是什么以及如何使它成为可能 利用各种人工智能技术超越精准医疗 如何利用物联网和人工智能环境计算提供患者护理 人工智能如何帮助减少医疗浪费 AI策略和如何识别高优先级AI应用

成为VIP会员查看完整内容
54
0

自1948年引入信息论以来,信息论已被证明在分析与压缩、存储和传输数据有关的问题方面起着重要作用。例如,信息论允许分析数据通信和压缩的基本限制,并在几十年的实际通信系统设计中发挥了作用。近年来,在使用信息理论方法解决数据压缩、数据通信和网络之外的问题方面出现了复兴,例如压缩感知、数据获取、数据分析、机器学习、图挖掘、社区检测、隐私和公平。在这本书中,我们探索了信号处理、机器学习、学习理论和统计的接口上的一系列广泛的问题,其中源自信息论的工具和方法可以提供类似的好处。几十年来,信息论在这一界面上的作用确实得到了承认。一个突出的例子是在1980年代使用互信息、度量熵和容量等信息理论量来建立估计的极大极小率。在这里,我们打算探索这个界面的现代应用,这些应用正在塑造21世纪的数据科学。

当然,标准信息理论工具与信号处理或数据分析方法之间有一些显著的差异。从整体上说,信息论倾向于关注渐近极限,使用大的块长度,并假设数据是由有限的比特数表示,并通过一个噪声信道观看。标准结果不关心复杂性,而是更多地关注通过可实现性和反向结果表征的基本限制。另一方面,一些信号处理技术,如采样理论,专注于离散时间表示,但不一定假设数据是量化的或系统中有噪声。信号处理通常关注的是最优的具体方法,即达到开发的极限,并具有有限的复杂性。因此,很自然地将这些工具结合起来,以解决更广泛的问题和分析,包括量化、噪声、有限样本和复杂性分析。

这本书的目的是为新兴的数据科学问题的信息理论方法的最近的应用提供一个综述。本书的潜在读者可能是信息理论、信号处理、机器学习、统计学、应用数学、计算机科学或相关研究领域的研究人员,或寻求了解信息理论和数据科学并在此界面上找出开放问题的研究生。本卷的特殊设计确保它可以作为研究人员和学生的教科书的最先进的参考。

这本书包含了16个不同的章节,由世界范围内公认的领先专家撰写,涵盖了信号处理、数据科学和信息论界面上的各种各样的主题。本书以信息理论的介绍作为其余章节的背景开始,也设置了贯穿全书使用的符号。接下来的章节被分为四类: 数据获取(第2-4章),数据表示和分析(第5-9章),信息论和机器学习(第10和11章),以及信息论、统计和压缩(第12-15章)。最后一章,第16章,通过对范诺不等式在一系列数据科学问题中的调研,将本书的几个主题联系起来。章节是独立的,涵盖了各自主题的最新研究结果,并且可以彼此独立地处理。

成为VIP会员查看完整内容
40
0

《工程师和科学家概率论和统计导论》第六版特别强调了概率论如何连接统计问题,从而帮助读者对实践工程师和科学家常用的统计程序建立直观的理解。利用真实的数据从实际研究跨越生命科学,工程,计算和商业,这个有用的介绍支持读者理解通过各种各样的练习和例子。结束的章节审查材料突出关键的想法,也讨论与每个材料的实际应用相关的风险。在新版中,涵盖了大数据和R。

这本书是为在工程项目中学习概率和统计课程的高年级本科生和研究生准备的,以及那些跨生物、物理和计算机科学部门的学生。它也适合于科学家,工程师和其他专业人员寻求参考的基础内容和应用这些领域。

  • 提供了作者独特的访问和参与方法为工程师和科学家的需要
  • 功能示例,使用来自生命科学、工程、计算和商业的实际研究的重要真实数据
  • 包括支持R的使用的新覆盖
  • 提供大数据技术的新章节

成为VIP会员查看完整内容
43
0

在过去的十年里,特别是在过去的三年里,隐私已经成为与用户联系并消费他们数据的企业的首要和中心。无论是保护数据免受黑客攻击和入侵,遵守复杂的法规,避免内部员工滥用数据,还是以可衡量的方式解决广泛的隐私问题,隐私正成为一个重大挑战,而不是一个利他的业余项目。

具有重大跨职能职责的技术领导必须平衡项目交付和跟踪,并需要实践技能和技术来实现隐私。本书将基于我在这方面的十多年经验提供这样的技巧。我不得不在有限的环境下匆忙创建隐私和安全程序,修复过去的错误,同时与一个既封闭又自主的团队合作。

这本书将教你通过帮助建立一个数据分类和目录来将隐私嵌入到你的数据中,开发数据共享技术,这样你就可以在不损害用户隐私的情况下进行创新,创建删除和模糊数据的机制,从法律和技术隐私的角度进行隐私审查,等等。

总而言之,这本书将为领导者们提供他们可以用来建立一个更适合他们公司的隐私程序的技巧,而不是那些价格不菲的现成的一刀切的产品。这些技能将帮助领导者与工程、数据科学、平台开发等团队建立联系,从而使数据隐私成为共同的目标。从那些曾经在那里工作过几次的人那里获得这些见解的好处,应该会使这本书成为一个有价值的资源。

为了人性化隐私的概念和海量数据背后的人类,这本书还将提供一系列故事和现实事件的分析,并将它们与有关数据隐私的决策联系起来。

在数据隐私问题上,你将学习如何:

  • 根据隐私风险对数据进行分类
  • 构建技术工具来编目和发现系统中的数据
  • 通过技术隐私控制共享数据,以衡量重新识别风险
  • 实现技术隐私架构来删除数据
  • 为数据导出建立技术能力,以满足法律要求,如数据主题资产请求(DSAR)
  • 建立技术隐私审查程序,以帮助加快法律隐私影响评估(PIA)
  • 设计一个同意管理平台(CMP)来获取用户同意
  • 实现安全工具来帮助优化隐私

数据隐私教你设计、开发和衡量隐私程序的有效性。您将从作者尼桑特·巴贾利亚(Nishant Bhajaria)那里学习,他是业界知名的专家,曾在谷歌、Netflix和Uber公司监管隐私。隐私的术语和法律要求都用清晰、无术语的语言解释。本书对业务需求的不断了解将帮助您权衡利弊,并确保您的用户隐私可以在不增加时间和资源成本的情况下得到改善。

https://www.manning.com/books/data-privacy

成为VIP会员查看完整内容
42
0

Python是访问、操作和从各种数据中获得见解的理想选择。Python for Data Science通过根植于实际示例和实践活动的边做边学的方法向您介绍Python的数据分析世界。您将学习如何编写Python代码来获取、转换和分析数据,为业务管理、市场营销和决策支持中的用例实践最先进的数据处理技术。

您将发现Python丰富的用于基本操作的内置数据结构集,以及用于数据科学的健壮的开源库生态系统,包括NumPy、pandas、scikit-learn、matplotlib等。这些示例展示了如何以各种格式加载数据,如何简化、分组和聚合数据集,以及如何创建图表、地图和其他可视化功能。后面的章节将深入展示真实世界的数据应用,包括使用位置数据为出租车服务提供动力,市场篮子分析来识别共同购买的商品,以及机器学习来预测股票价格。

这本书从数据处理和分析的概念介绍开始,解释一个典型的数据处理管道。然后,我们将介绍Python的内置数据结构和一些广泛用于数据科学应用程序的第三方Python库。接下来,我们将探讨用于获取、组合、聚合、分组、分析和可视化不同大小和数据类型的数据集的日益复杂的技术。随着本书的深入,我们将把Python数据科学技术应用到商业管理、市场营销和金融领域的实际用例中。每一章都包含“练习”部分,这样你就可以练习和巩固你刚刚学到的知识。

第一章: 数据的基础知识为理解使用数据的基本要素提供了必要的背景知识。您将了解到数据有不同的类别,包括结构化、非结构化和半结构化数据。然后,您将了解典型数据分析过程中涉及的步骤。

第二章:Python数据结构介绍Python内置的四种数据结构:列表、字典、元组和集合。您将看到如何使用每个结构,以及如何将它们组合成更复杂的结构,可以表示现实世界的对象。

第三章:Python数据科学库讨论了Python健壮的第三方数据分析和操作库生态系统。您将看到pandas库及其主要数据结构Series和DataFrame,它们已经成为面向数据的Python应用程序的实际标准。您还将了解NumPy和scikit-learn,这两个库通常用于数据科学。

第四章:从文件和api访问数据深入了解获取数据并将其加载到脚本中的细节。您将学习如何将不同来源的数据(如文件和api)加载到Python脚本中的数据结构中,以便进行进一步处理。

第五章:使用数据库继续讨论将数据导入Python,涵盖了如何使用数据库数据。您将看到访问和操作存储在不同类型数据库中的数据的示例,包括关系数据库(如MySQL)和NoSQL数据库(如MongoDB)。 第六章:聚合数据通过对数据进行分组并进行聚合计算来解决汇总数据的问题。您将学习使用pandas对数据进行分组,并生成小计、总计和其他聚合。 第七章:结合数据集介绍了如何将来自不同数据源的数据组合为一个单独的数据集。您将学习SQL开发人员用于连接数据库表的技术,并将它们应用于内置的Python数据结构、NumPy数组和pandas DataFrames。 第八章:创建可视化讨论可视化是最自然的方式揭露隐藏的数据中的模式。您将了解不同类型的可视化,如线形图、条形图和直方图,并将了解如何使用用于绘图的主要Python库Matplotlib创建它们。您还将使用Cartopy库来生成映射。 第九章:分析位置数据解释如何使用geopy和Shapely库处理位置数据。您将学习获取和使用静止和移动物体的GPS坐标的方法,并将探索拼车服务如何为给定的皮卡识别最佳汽车的现实世界示例。 第十章:分析时间序列数据提出了一些分析技术可以应用于时间序列数据中提取有意义的数据。特别地,本章中的例子说明了时间序列数据分析如何应用于股票市场数据。 第十一章:从数据中获得洞察力探讨了从数据中获得洞察力的策略,以便做出明智的决定。例如,您将学习如何发现超市中销售的产品之间的关联,从而确定在一次交易中经常一起购买的商品组(对推荐和促销有用)。 第十二章:机器学习数据分析涵盖了使用scikitlearn先进的数据分析任务。您将训练机器学习模型,根据产品的星级评级对产品评论进行分类,并预测股票价格的趋势。

成为VIP会员查看完整内容
39
0

早期基于规则的人工智能表现出了有趣的决策能力,但缺乏感知能力,也不会学习。如今,拥有机器学习感知和深度强化学习能力的人工智能,可以对特定任务执行超人般的决策。这本书向您展示了如何将早期AI的实用性与深度学习能力和工业控制技术相结合,在现实世界中做出可靠的决策。

使用具体的例子,最小的理论,和一个经过验证的架构框架,作者Kence Anderson展示了如何教自主AI明确的技能和策略。您将学习何时以及如何使用和结合各种AI架构设计模式,以及如何在不需要操纵神经网络或机器学习算法的情况下设计高级AI。学生、流程操作员、数据科学家、机器学习算法专家以及拥有和管理工业流程的工程师可以使用本书中的方法论来设计自主AI。

这本书探讨:

自动化、自主和人类决策的区别和局限性 自主AI在实时决策方面的独特优势,具有用例 如何从模块化组件设计一个自主的AI并记录你的设计

成为VIP会员查看完整内容
38
0

时间序列分析技术的理论和应用方面的相关书籍较少,特别是在水资源工程领域。因此,许多水文工作者和水文地质工作者难以将时间序列分析作为研究工具之一。这本书通过提供时间序列分析的理论和实践方面的适当混合填补了这一空白。它涉及水文/水资源工程中时间序列特征的全面概述、分析时间序列数据的各种工具和技术、31种可用统计检验的理论细节以及将它们应用于真实时间序列数据的详细程序、随机建模的理论和方法,以及水文科学中时间序列分析的现状。此外,它通过一个案例研究证明了大多数时间序列测试的应用,并对各种时间序列测试进行了比较性能评价,同时还邀请了印度和国外的四个案例研究。

本书不仅是学生和教师在水资源工程方面的教科书,而且将成为教育研究人员/科学家关于水文科学的时间序列分析的理论和实践的最全面的参考。这本书将非常有用的学生,研究人员,教师和专业人员涉及水资源,水文,生态学,气候变化,地球科学,和环境研究。

https://link.springer.com/book/10.1007/978-94-007-1861-6

成为VIP会员查看完整内容
33
0

这本书把边缘智能分为AI for edge(智能使能边缘计算)和AI on edge(人工智能on edge)。重点讨论了如何通过有效的AI技术为边缘计算中的关键问题提供最优解决方案,并讨论了如何在边缘上构建AI模型,即模型训练和推理。这本书从更广阔的视野和视角为边缘计算的这个新的跨学科领域提供了见解。作者讨论了边缘计算的机器学习算法以及该技术的未来需求和潜力。作者还解释了核心概念、框架、模式和研究路线图,为边缘智能的潜在未来研究计划提供了必要的背景。

本书的目标读者包括学者、研究学者、工业专家、科学家和在物联网(IoT)或边缘计算领域工作的研究生,希望添加机器学习来增强他们的工作能力。

本书探讨了以下主题: 边缘计算、边缘计算AI硬件、边缘虚拟化技术 边缘智能和深度学习的应用、训练和优化 用于边缘计算的机器学习算法 讨论了未来边缘计算的需求

成为VIP会员查看完整内容
30
0

**《人工智能成功之道: 如何让人工智能为你的业务工作》**一书的目的是帮助你领导一个人工智能项目走向商业成功。这本书首先向您展示了如何选择能够获得商业成功的AI项目,然后是如何以实现商业成功的方式运行这些项目。

我写这本书是为了那些肩负着用人工智能实现成果的任务,并将技术视为实现这些成果的工具的商业领袖。我也为正在与这样一位商业领袖合作并提供建议的领导团队写了这本书。作为先决条件,这本书的读者应该有成功软件项目领导团队的经验,并且应该了解他们组织的业务基础。虽然不需要工程背景或对人工智能有深入的了解,但需要有开放的思想,并愿意促进具有技术和商业背景的人之间的对话。我还为专注于领导力和商业的数据科学家以及想要更多地了解AI方法的商业应用的数据科学家写了这本书。我故意不把重点放在AI的特定技术上,所以如果你只对AI的技术方面感兴趣,这本书不适合你。

https://www.manning.com/books/succeeding-with-ai

本书共分为八章:

第一章是今天AI项目概况的介绍。它向您介绍了成功AI项目的关键元素和良好元素,并帮助您理解基于AI项目结果可以采取的业务行动。它还提供了一个成功的AI项目应该使用的过程的高级概述。

第二章向你介绍了项目领导者必须知道的关于AI的话题。它帮助您发现哪些业务问题可以从AI的使用中受益,并将AI功能与您需要解决的业务问题进行匹配。它还可以帮助您发现团队中可能影响项目的任何数据科学技能差距。

第三章帮助您选择您的第一个AI项目,并针对您的业务问题制定一个研究问题。它还提出了在选择AI项目时要避免的陷阱,以及此类项目的最佳实践。

第四章向您展示了如何将业务和技术度量联系起来,以及如何在业务术语中度量技术进步。它还向您展示了如何克服您在第一个AI项目开始时通常会遇到的组织障碍。

第五章帮助你理解ML管道以及它在项目生命周期中是如何发展的。它向您展示了如何在您提出的业务问题、您需要的数据和您应该使用的AI算法之间平衡注意力。

第六章向您展示了如何确定您的AI项目是否使用了正确的ML管道。它向您介绍了名为MinMax分析的技术,并向您展示了如何执行它和解释它的结果。

第七章向您展示了如何正确地选择ML管道的正确部分,从而提高业务效果。它还介绍了敏感性分析技术,并演示了如何解释其结果,以及如何解释长时间运行的AI项目中的时间流逝。

第八章关注人工智能的趋势以及它们将如何影响你。本章将向您介绍AutoML(数据科学家在AI领域工作的自动化)等趋势,并探讨AI与因果关系和物联网(IoT)系统之间的关系。它还将AI系统错误与人类所犯的典型错误进行对比,并向您展示如何在您的项目中考虑这些差异。

成为VIP会员查看完整内容
30
0
登陆后查看更多精品内容
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员