在这个反事实和因果推理的第二版中,讲述了反事实方法的基本特征,观察数据分析来自社会,人口统计和健康科学的例子。首先介绍了使用潜在结果模型和因果图的替代估计技术; 在此之后,条件调节技术,如匹配和回归,从潜在结果的角度提出。在没有观察到重要的因果公开决定因素的研究情景中,然后提出了替代技术,如工具变量估计、纵向方法和通过因果机制的估计。本书强调了因果效应异质性的重要性,并讨论了通过机制进行深度因果解释的必要性。

在过去的三十年里,一个反事实的因果模型已经被开发出来,一个统一的框架起诉的因果问题现在是可用的。通过这本书,我们的目标是说服更多的社会科学家将这个模型应用到社会科学的核心经验问题上。

在第2章介绍了反事实模型的主要部分之后,我们将在本书的第2部分介绍因果效应估计的条件反射技术。在第三章中,我们将使用因果图来展示一个基本的条件作用框架。然后,在第4章和第5章,我们将解释匹配和回归估计量,说明它们是更一般条件作用方法的互补变量。在这本书的第三部分,我们将从因果效应估计的“容易”到“困难”的实例进行转换,对于这种情况,简单的条件作用是不够的,因为决定因果公开的相关变量没有被观察到。在第6章介绍了一般性困境之后,我们将在第7章至第9章中介绍工具变量技术、基于机制的因果效应估计,以及使用超时数据来估计因果效应。最后,在第十章中,我们将总结一些反对反事实模型的意见。在本书的结尾,我们将对因果调研的互补模式进行广泛的讨论,这些模式包括观察社会科学中的因果效应估计。在某种程度上,因为详细的目录已经给出了我们将在其余章节中呈现的材料的准确描述,我们在这里不提供一套详细的章节摘要。相反,我们将用三个因果图和它们所提出的因果效应估计策略来结束这一介绍性的章节。这些图表使我们能够预示许多具体的因果效应估计策略,我们将在后面介绍这些策略。因为本章的其余内容将在以后重新介绍和更全面地解释(主要在第3、6和8章),所以现在可以跳过它,没有任何后果。然而,我们在教学这一材料的经验表明,在考虑观察数据分析的反事实框架的细节之前,许多读者可能受益于对基本估计技术的快速图形介绍。

作者姓名: Stephen Morgan Christopher Winship

作者机构: 约翰霍普金斯大学 哈佛大学

图书目录 一、社会科学中的因果关系与实证研究 1 简介 二、反事实、潜在结果和因果图 2 反事实和潜在结果模型 3 因果图 三、通过对观察到的变量进行条件调节以阻止后门路径来估计因果效应 4 因果暴露模型和识别标准 5 因果效应的匹配估计量 6 因果效应的回归估计 7 因果效应的加权回归估计 四、估计后门调节无效时的因果效应 8 自我选择、异质性和因果图 9 因果效应的工具变量估计量 10 机制与因果解释 11 重复观察和因果效应估计 五、当因果效应不是由可观测点识别时的V估计 12 分布假设、集合识别和敏感性分析 六、结论 13 反事实与观察社会科学实证研究的未来

成为VIP会员查看完整内容
1
36

相关内容

近年来,图论已经成为一个重要的数学工具在广泛的学科,从运筹学和化学到遗传学和语言学,从电气工程和地理学到社会学和建筑学。与此同时,它本身也成为一门有价值的数学学科。鉴于此,有必要编写一份廉价的关于这一主题的介绍性文本,既适合学习图论课程的数学家,也适合希望尽快学习这一主题的非专业人士。我希望这本书能在某种程度上满足这一需求。阅读它的唯一先决条件是初等集合理论和矩阵理论的基本知识,尽管抽象代数的进一步知识需要更困难的练习。

这本书的内容可以很方便地分为四部分。第一部分(1-4章)提供了一个基本的基础课程,包括图的定义和例子,连通性,欧拉和哈密顿路径和循环,以及树。接下来是关于平面性和着色的两章(第5章和第6章),特别提到了四色定理。第三部分(第7章和第8章)讨论有向图理论和截线理论,以及在关键路径分析、马尔可夫链和网络流中的应用。书的最后一章是关于matroids的(第9章),这一章将前几章的材料联系在一起,并介绍了一些最近的发展。

成为VIP会员查看完整内容
0
45

这本书的故事始于我被指派在佛罗里达州立大学教授一门金融数学入门课程。最初,这门课的内容是测量理论、集成和随机分析。然后,它发展到包括测度理论,一些概率论,二项模型中的期权定价。当我接手这门课程时,我不确定我要做什么。然而,我的愿景是在保留经典的风险管理材料的同时,教授学生一些新的金融数学主题。

这本书的前两章只要求微积分和概率论,可以教高年级本科生。在附录的a .1和B节中也有对这些主题的简要回顾。我在附录中尽量简短;许多书籍,包括金融随机微积分I([27,28])和凸优化([8]),涵盖了这些主题广泛。第一章的主要目标是使读者熟悉金融数学中风险管理的基本概念。所有这些概念首先是在一个相对非技术的一个时期框架,如马科维茨投资组合多样化或阿罗-德布鲁市场模型。第二章将Arrow-Debreu市场模型的关键结果推广到多周期情况,并介绍了多周期二项式模型及其数值方法。第3章讨论了更高级的概率主题,这些主题将在附录B和C部分的剩余部分介绍。这一章更适合研究生。在第3.2节中,我们首先通过Bachelier模型建立了连续时间中重要的概念和计算方法。然后,我们在第3.3节中提供了更现实的Black-Scholes模型的概要。第四章讨论了一种特定的金融衍生品的定价:美国期权。第4.0.1和4.1节可以在完成第2章后直接学习。本节的其余部分需要理解第3.3节作为先决条件。

成为VIP会员查看完整内容
0
42

本书是信息论领域中一本简明易懂的教材。主要内容包括:熵、信源、信道容量、率失真、数据压缩与编码理论和复杂度理论等方面的介绍。

本书还对网络信息论和假设检验等进行了介绍,并且以赛马模型为出发点,将对证券市场研究纳入了信息论的框架,从新的视角给投资组合的研究带来了全新的投资理念和研究技巧。

本书适合作为电子工程、统计学以及电信方面的高年级本科生和研究生的信息论基础教程教材,也可供研究人员和专业人士参考。

本书是一本简明易懂的信息论教材。正如爱因斯坦所说:“凡事应该尽可能使其简单到不能再简单为止。''虽然我们没有深人考证过该引语的来源(据说最初是在幸运蛋卷中发现的),但我们自始至终都将这种观点贯穿到本书的写作中。信息论中的确有这样一些关键的思想和技巧,一旦掌握了它们、不仅使信息论的主题简明,而且在处理新问題时提供重要的直觉。本书来自使用了十多年的信息论讲义,原讲义是信息论课程的高年级本科生和一年级研究生两学期用的教材。本书打算作为通信理论.计算机科学和统计学专业学生学习信息论的教材。

信息论中有两个简明要点。第一,熵与互信息这样的特殊量是为了解答基本问题而产生的。例如,熵是随机变量的最小描述复杂度,互信息是度量在噪声背景下的通信速率。另外,我们在以后还会提到,互信息相当于已知边信息条件下财富双倍的增长。第二,回答信息理论问邀的答案具有自然的代数结构。例如,熵具有链式法则,因而,谪和互信息也是相关的。因此,数据压缩和通信中的问题得到广泛的解释。我们都有这样的感受,当研究某个问题时,往往历经大量的代数运算推理得到了结果,但此时没有真正了解问题的全莪,最终是通过反复观察结果,才对整个问题有完整、明确的认识。所以,对一个问题的全面理解,不是靠推理,而是靠对结果的观察。要更具体地说明这一点,物理学中的牛顿三大定律和薛定谔波动方程也许是最合适的例子。谁曾预见过薛定谔波动方程后来会有如此令人敬畏的哲学解释呢?

在本书中,我们常会在着眼于问题之前,先了解一下答案的性质。比如第2章中,我们定义熵、相对熵和互信息,研究它们之间的关系,再对这些关系作一点解释·由此揭示如何融会贯通地使用各式各样的方法解决实际问题。同理,我们顺便探讨热力学第二定律的含义。熵总是增加吗?答案既肯定也否定。这种结果会令专家感兴趣,但初学者或i午认为这是必然的而不会深人考虑。

在实际教学中.教师往往会加人一自己的见解。事实上,寻找无人知道的证明或者有所创新的结果是一件很愉快的事情。如果有人将新的思想和已经证明的内容在课堂上讲解给学生,那么不仅学生会积极反馈“对,对,对六而且会大大地提升教授该课程的乐崆我们正是这样从研究本教材的许多新想法中获得乐趣的。

本书加人的新素材实例包括信息论与博弈之间的关系,马尔可夫链背景下热力学第二定律的普遍性问题,信道容量定理的联合典型性证明,赫夫曼码的竞争最优性,以及关于最大熵谱密度估计的伯格(回定理的证明。科尔莫戈罗夫复杂度这一章也是本书的独到之处。面将费希尔信息,互信息、中心极限定理以及布伦一闵可夫斯基不等式与熵幂不等式联系在一起,也是我们引以为豪之处。令我们感到惊讶的是.关于行列式不等式的许多经典结论,当利用信息论不等式后会很容易得到证明。

自从香农的奠基性论文面世以来,尽管信息论已有了相当大的发展,但我们还是要努力强调它的连贯性。虽然香农创立信息论时受到通信理论中的问题启发,然而我们认为信息论是一门独立的学科,可应用于通信理论和统计学中。我们将信息论作为一个学科领域从通信理论、概率论和统计学的背景中独立出来因为明显不可能从这些学科中获得难以理解的信息概念。由于本书中绝大多数结论以定理和证明的形式给出,所以,我们期望通过对这些定理的巧妙证明能说明这些结论的完美性。一般来讲,我们在介绍问题之前先描述回题的解的性质,而这些很有的性质会使接下来的证明顺理成章。

使用不等式串、中间不加任何文字、最后直接加以解释,是我们在表述方式上的一项创新希望读者学习我们所给的证明过程达到一定数量时,在没有任何解释的情况下就能理解其中的大部分步,并自己给出所需的解释这些不等式串好比模拟到试题,读者可以通过它们确认自己是否已掌握证明那些重要定理的必备知识。这些证明过程的自然流程是如此引人注目,以至于导致我们轻视了写作技巧中的某条重要原则。由于没有多余的话,因而突出了思路的逻辑性与主題思想u我们希望当读者阅读完本书后,能够与我们共同分亨我们所推崇的,具有优美、简洁和自然风格的信息论。

本书广泛使用弱的典型序列的方法,此概念可以追溯到香农1948年的创造性工作,而它真正得到发展是在20世纪70年代初期。其中的主要思想就是所谓的渐近均分性(AEP),或许可以粗略地说成“几乎一切事情都是等可能的"

第2章阐述了熵、相对熵和互信息之同的基本代数关系。渐近均分性是第3章重中之重的内容,这也使我们将随机过程和数据压缩的熵率分别放在第4章和第5章中论述。第6章介绍博弈,研究了数据压缩的对偶性和财富的增长率。可作为对信息论进行理性思考基础的科尔莫戈罗夫复杂度,拥有着巨大的成果,放在第14章中论述。我们的目标是寻找一个通用的最矩描述,而不是平均意义下的次佳描述。的确存在这样的普遍性概念用来刻画一个对象的复杂度。该章也论述了神奇数0,揭示数学上的不少奥秘,是图灵机停止运转概率的推广。第7章论述信道容量定理。第8章叙述微分熵的必需知识,它们是将早期容量定理推广到连续噪声信道的基础。基本的高斯信道容量问题在第9章中论述。第il章阐述信息论和统计学之间的关系,20世纪年代初期库尔贝克首次对此进行了研究,此后相对被忽视。由于率失真理论比无噪声数据压缩理论需要更多的背景知识,因而将其放置在正文中比较靠后的第10章。

网络信息理论是个大的主题,安排在第巧章,主要研究的是噪声和干扰存在情形下的同时可达的信息流。有许多新的思想在网络信息理论中开始活跃起来,其主要新要素有干扰和反馈第16章讲述股票市场,这是第6章所讨论的博弈的推广,也再次表明了信息论和博弈之间的紧密联系。第17章讲述信息论中的不等式,我们借此一隅把散布于全书中的有趣不等式重新收拢在一个新的框架中,再加上一些关于随机抽取子集熵率的有趣新不等式。集合和的体积的布伦一闵可夫斯基不等式,独立随机变量之和的有效方差的熵幂不等式以及费希尔信息不等式之间的美妙关系也将在此章中得到详尽的阐述。

本书力求推理严密,因此对数学的要求相当高·要求读者至少学过一学期的概率论课程且有扎实的数学背景,大致为本科高年级或研究生一年级水平。尽管如此,我们还是努力避免使用测度论。因为了解它只对第16章中的遍历过程的AEP的证明过程起到简化作用。这符合我们的观点,那就是信息论基础与技巧不同,后者才需要将所有推广都写进去。

本书的主体是第2,3,4,5,7,8,9,10,11和巧章,它们自成体系,读懂了它们就可以对信息论有很好的理解。但在我们看来,第14章的科尔莫戈罗夫复杂度是深人理解信息论所需的必备知识。余下的几章,从博弈到不等式.目的是使主题更加连贯和完美。

成为VIP会员查看完整内容
0
108

近年来,机器学习取得了显著进展,提供了一些新功能,比如创建复杂的、可计算的文本和图像表示。这些功能催生了新产品,如基于图像内容的图像搜索、多种语言之间的自动翻译,甚至是真实图像和声音的合成。同时,机器学习已经在企业中被广泛采用,用于经典的用例(例如,预测客户流失、贷款违约和制造设备故障)。

在机器学习取得成功的地方,它是非常成功的。

在许多情况下,这种成功可以归因于对大量训练数据的监督学习(结合大量计算)。总的来说,有监督的学习系统擅长于一项任务:预测。当目标是预测一个结果,并且我们有很多这个结果的例子,以及与它相关的特征时,我们可能会转向监督学习。

随着机器学习的普及,它在业务流程中的影响范围已经从狭窄的预测扩展到决策制定。机器学习系统的结果经常被用来设定信用限额,预测制造设备故障,以及管理我们的各种新闻推送。当个人和企业试图从这些复杂和非线性系统提供的信息中学习时,更多(和更好)的可解释性方法已经被开发出来,这是非常重要的。

然而,仅仅基于预测的推理有一些基本的限制。例如,如果银行提高客户的信用额度会发生什么?这些问题不能用建立在先前观察到的数据上的相关模型来回答,因为它们涉及到客户选择的可能变化,作为对信用限额变化的反应。在很多情况下,我们的决策过程的结果是一种干预——一种改变世界的行动。正如我们将在本报告中展示的,纯粹相关的预测系统不具备在这种干预下进行推理的能力,因此容易产生偏差。对于干预下的数据决策,我们需要因果关系。

即使对于纯粹的预测系统(这是监督学习的强项),应用一些因果思维也会带来好处。根据因果关系的定义,它们是不变的,这意味着它们在不同的情况和环境中都是正确的。对于机器学习系统来说,这是一个非常理想的特性,在机器学习系统中,我们经常根据我们在训练中没有看到的数据进行预测;我们需要这些系统具有适应性和健壮性。

因果推理和机器学习的交集是一个迅速扩展的研究领域。它已经产生了可供主流采用的功能——这些功能可以帮助我们构建更健壮、可靠和公平的机器学习系统。

本书介绍了因果推理,因为它涉及很多数据科学和机器学习工作。我们引入因果图,着重于消除理解的概念障碍。然后我们利用这个理解来探索关于不变预测的最新想法,它给高维问题带来了因果图的一些好处。通过附带的原型,我们展示了即使是经典的机器学习问题,如图像分类,也可以从因果推理工具中受益。

成为VIP会员查看完整内容
0
141

【导读】哈佛大学公共卫生学院(HSPH)Miguel Hernan与Jamie Robins 教授共同编著了关于因果逻辑推断方面的书作《Causal Inference: What If》,总共分3个部分,22章,311多页,对因果推理的概念和方法做了系统性阐述,是各个领域包括经济学、健康医疗、心理学、计算机等从业人士的重要参鉴材料。

地址: https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/

在本书中,我们强调需要足够认真对待因果问题,才能明确表述它,我们还区别了数据和因果推断假设的不同作用。一旦建立了这些基础,因果推断就必然变得不那么随意,这有助于防止混淆。然后,本书描述了各种数据分析方法,这些方法可用于在收集一组人口中每个个体的数据时,在一组特定的假设下估算感兴趣的因果关系。本书的一个关键信息是,因果推断不能简化为用于数据分析技巧的集合。

本书分为三个难度越来越大的部分:第一部分讲述没有模型的因果推断(即,因果关系的非参数辨识),第二部分是关于模型的因果推论(即,通过参数化模型对因果关系的估计),第三部分从复杂的纵贯数据中得出因果关系的推断(即,估算时变处理的因果关系)。全书还专门设置了很多要点(Fine Points)和技术点(Technical points),解释了正文中提到的某些主题。要点针对所有读者,而技术点则是为接受过统计学方面中等程度训练的读者设计的。本书对之前分散在多个学科期刊中的因果推断概念和方法进行了紧凑的介绍。我们希望对因果推断感兴趣的任何学科的读者都能有所裨益,例如流行病、统计学、心理学、经济学、社会学、政治学、计算机科学。

第 1-10 章重点讲述一些基本概念,通过大量的简单实例和图形的方式,深入浅出地介绍了因果推断中的核心概念和方法。第 11-18 章讲述了各种各样用于进行因果推断的模型,包括工具变量法 (IV)、倾向得分匹配分析 (PSM)、调节效应、结构方程等。第 19-25 章介绍了较为复杂的情形,如面板数据、 动态处理效应、反馈效应等。

目录内容: 第一部分 无模型的因果推断 1 A definition of causal effect 3 2 Randomized experiments 13 3 Observational studies 25 4 Effect modification 41 5 Interaction 55 6 Graphical representation of causal effects 69 7 Confounding 83 8 Selection bias 99 9 Measurement bias 113 10 Random variability 123

第二部分 有模型的因果推断
11 Why model? 139 12 IP weighting and marginal structural models 149 13 Standardization and the parametric g-formula 161 14 G-estimation of structural nested models 171 15 Outcome regression and propensity scores 183 16 Instrumental variable estimation 193 17 Causal survival analysis 209 18 Variable selection for causal inference 223

第三部分 复杂纵向数据因果推断 19 Time-varying treatments 235
20 Treatment-confounder feedback 247 21 G-methods for time-varying treatments 257 22 Target trial emulation 277

成为VIP会员查看完整内容
0
72

这本书系统性讲述了统计学理论,包括概率理论、分布式理论与统计模型,基本统计理论、贝叶斯理论、无偏点估计、最大似然统计推断、统计假设与置信集、非参与鲁棒推断。

第一门课程以对统计中有用的测量论概率论的概念和结果的简要概述开始。随后讨论了统计决策理论和推理中的一些基本概念。探讨了估计的基本方法和原理,包括各种限制条件下的最小风险方法,如无偏性或等方差法,最大似然法,以及矩法和其他插件方法等函数法。然后详细地考虑了贝叶斯决策规则。详细介绍了最小方差无偏估计的方法。主题包括统计量的充分性和完全性、 Fisher信息、估计量的方差的界、渐近性质和统计决策理论,包括极大极小和贝叶斯决策规则。

第二门课程更详细地介绍了假设检验和置信集的原理。我们考虑了决策过程的表征,内曼-皮尔森引理和一致最有力的测试,置信集和推理过程的无偏性。其他主题包括等方差、健壮性和函数估计。

除了数理统计的经典结果外,还讨论了马尔可夫链蒙特卡洛理论、拟似然、经验似然、统计泛函、广义估计方程、折刀法和自举法。

http://mason.gmu.edu/~jgentle/books/MathStat.pdf

成为VIP会员查看完整内容
0
62

这是我2004年,2006年和2009年在斯坦福大学教授的概率理论博士课程的讲义。本课程的目标是为斯坦福大学数学和统计学系的博士生做概率论研究做准备。更广泛地说,文本的目标是帮助读者掌握概率论的数学基础和在这一领域中证明定理最常用的技术。然后将此应用于随机过程的最基本类的严格研究。

为此,我们在第一章中介绍了测度与积分理论中的相关元素,即事件的概率空间与格-代数、作为可测函数的随机变量、它们的期望作为相应的勒贝格积分,以及独立性的重要概念。

利用这些元素,我们在第二章中研究了随机变量收敛的各种概念,并推导了大数的弱定律和强定律。

第三章讨论了弱收敛的理论、分布函数和特征函数的相关概念以及中心极限定理和泊松近似的两个重要特例。

基于第一章的框架,我们在第四章讨论了条件期望的定义、存在性和性质,以及相关的规则条件概率分布。

第五章讨论了过滤、信息在时间上的级数的数学概念以及相应的停止时间。关于后者的结果是作为一组称为鞅的随机过程研究的副产品得到的。讨论了鞅表示、极大不等式、收敛定理及其各种应用。为了更清晰和更容易的表述,我们在这里集中讨论离散时间的设置来推迟与第九章相对应的连续时间。

第六章简要介绍了马尔可夫链的理论,概率论的核心是一个庞大的主题,许多教科书都致力于此。我们通过研究一些有趣的特殊情况来说明这类过程的一些有趣的数学性质。

在第七章中,我们简要介绍遍历理论,将注意力限制在离散时间随机过程的应用上。我们定义了平稳过程和遍历过程的概念,推导了Birkhoff和Kingman的经典定理,并强调了该理论的许多有用应用中的少数几个。

第八章建立了以连续时间参数为指标的右连续随机过程的研究框架,引入了高斯过程族,并严格构造了布朗运动为连续样本路径和零均值平稳独立增量的高斯过程。

第九章将我们先前对鞅和强马尔可夫过程的处理扩展到连续时间的设定,强调了右连续滤波的作用。然后在布朗运动和马尔可夫跳跃过程的背景下说明了这类过程的数学结构。

在此基础上,在第十章中,我们利用不变性原理重新构造了布朗运动作为某些重新标定的随机游动的极限。进一步研究了其样本路径的丰富性质以及布朗运动在clt和迭代对数定律(简称lil)中的许多应用。

https://statweb.stanford.edu/~adembo/stat-310b/lnotes.pdf

成为VIP会员查看完整内容
0
73

本课程的教材是从机器学习的角度写的,是为那些有必要先决条件并对学习因果关系基础感兴趣的人而开设的。我尽我最大的努力整合来自许多不同领域的见解,利用因果推理,如流行病学、经济学、政治学、机器学习等。

有几个主要的主题贯穿全课程。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

成为VIP会员查看完整内容
0
97

有几个主要的主题贯穿全书。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

https://www.bradyneal.com/causal-inference-course

成为VIP会员查看完整内容
0
145

数十年来,因果推理是一个跨统计、计算机科学、教育、公共政策和经济学等多个领域的重要研究课题。目前,与随机对照试验相比,利用观测数据进行因果关系估计已经成为一个有吸引力的研究方向,因为有大量的可用数据和较低的预算要求。随着机器学习领域的迅速发展,各种针对观测数据的因果关系估计方法层出不穷。在这项调查中,我们提供了一个全面的综述因果推理方法下的潜在结果框架,一个众所周知的因果推理框架。这些方法根据是否需要潜在结果框架的所有三个假设分为两类。对于每一类,分别对传统的统计方法和最近的机器学习增强方法进行了讨论和比较。并介绍了这些方法的合理应用,包括在广告、推荐、医药等方面的应用。此外,还总结了常用的基准数据集和开放源代码,便于研究者和实践者探索、评价和应用因果推理方法。

地址:

https://www.zhuanzhi.ai/paper/a37f27ed97e5318b30be2999e9a768c3

成为VIP会员查看完整内容
0
143
小贴士
相关VIP内容
专知会员服务
45+阅读 · 7月2日
专知会员服务
108+阅读 · 3月22日
专知会员服务
62+阅读 · 2020年12月6日
专知会员服务
73+阅读 · 2020年12月3日
专知会员服务
97+阅读 · 2020年9月1日
专知会员服务
145+阅读 · 2020年8月25日
相关论文
A Bibliometric Analysis of the Surveys in Blockchain
Hira Ahmad,Muhammad Ahtazaz Ahsan,Adnan Noor Mian
0+阅读 · 9月20日
Abhimanyu Dubey,Vignesh Ramanathan,Alex Pentland,Dhruv Mahajan
5+阅读 · 3月30日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Xusheng Luo,Luxin Liu,Yonghua Yang,Le Bo,Yuanpeng Cao,Jinhang Wu,Qiang Li,Keping Yang,Kenny Q. Zhu
12+阅读 · 2020年3月30日
Emmanuel Bengio,Joelle Pineau,Doina Precup
8+阅读 · 2020年3月13日
Conceptualize and Infer User Needs in E-commerce
Xusheng Luo,Yonghua Yang,Kenny Q. Zhu,Yu Gong,Keping Yang
3+阅读 · 2019年10月8日
Learning latent representations for style control and transfer in end-to-end speech synthesis
Ya-Jie Zhang,Shifeng Pan,Lei He,Zhen-Hua Ling
5+阅读 · 2019年2月14日
Area Attention
Yang Li,Lukasz Kaiser,Samy Bengio,Si Si
5+阅读 · 2019年2月5日
Inferring Concept Hierarchies from Text Corpora via Hyperbolic Embeddings
Matt Le,Stephen Roller,Laetitia Papaxanthos,Douwe Kiela,Maximilian Nickel
8+阅读 · 2019年2月3日
Top