This paper discusses the problem of causal query in observational data with hidden variables, with the aim of seeking the change of an outcome when "manipulating" a variable while given a set of plausible confounding variables which affect the manipulated variable and the outcome. Such an "experiment on data" to estimate the causal effect of the manipulated variable is useful for validating an experiment design using historical data or for exploring confounders when studying a new relationship. However, existing data-driven methods for causal effect estimation face some major challenges, including poor scalability with high dimensional data, low estimation accuracy due to heuristics used by the global causal structure learning algorithms, and the assumption of causal sufficiency when hidden variables are inevitable in data. In this paper, we develop a theorem for using local search to find a superset of the adjustment (or confounding) variables for causal effect estimation from observational data under a realistic pretreatment assumption. The theorem ensures that the unbiased estimate of causal effect is included in the set of causal effects estimated by the superset of adjustment variables. Based on the developed theorem, we propose a data-driven algorithm for causal query. Experiments show that the proposed algorithm is faster and produces better causal effect estimation than an existing data-driven causal effect estimation method with hidden variables. The causal effects estimated by the proposed algorithm are as accurate as those by the state-of-the-art methods using domain knowledge.


翻译:本文讨论观察数据的因果查询问题,其中含有隐藏变量,目的是在“管理”变量时寻求改变结果,同时给出一系列影响被操纵变量和结果的貌似可信的折叠变量,从而影响被操纵变量和结果。在本文中,“数据实验”用于估计被操纵变量的因果效应,有助于用历史数据验证实验设计,或在研究新关系时探索混淆因素。然而,现有的因果估计数据驱动方法面临一些重大挑战,包括:高维度数据的可调度差,由于全球因果结构学习算法使用的超常性导致估算准确性低,以及在数据中无法避免隐藏变量时假设因果充足性。在本文中,我们开发了一种理论,用于使用本地搜索,以根据现实的预处理假设,从观察数据中找出调整(或纠结)因果估计结果的超常值。该理论确保根据调整变量的超常估计的因果影响纳入一套估计。基于已开发的因果影响,我们提议用一种数据驱动的因果估计方法,即以现有因果估计的因果分析方法提出一种更快速的因果估计。

2
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
121+阅读 · 2020年11月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
75+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
113+阅读 · 2020年1月1日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
143+阅读 · 2019年10月12日
已删除
将门创投
4+阅读 · 2018年11月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Design and Analysis of Switchback Experiments
Arxiv
0+阅读 · 2021年1月14日
Arxiv
0+阅读 · 2021年1月12日
Arxiv
108+阅读 · 2020年2月5日
Arxiv
3+阅读 · 2018年1月10日
VIP会员
相关VIP内容
【干货书】机器学习速查手册,135页pdf
专知会员服务
121+阅读 · 2020年11月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
75+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
113+阅读 · 2020年1月1日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
143+阅读 · 2019年10月12日
相关资讯
已删除
将门创投
4+阅读 · 2018年11月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员