基于分布学习的加权治疗效果估计

394

收藏 2022-05-16

英文标题：
《Weighting-Based Treatment Effect Estimation via Distribution Learning》
---
作者：
Dongcheng Zhang, Kunpeng Zhang
---
最新提交年份：
2021
---
英文摘要：
Existing weighting methods for treatment effect estimation are often built upon the idea of propensity scores or covariate balance. They usually impose strong assumptions on treatment assignment or outcome model to obtain unbiased estimation, such as linearity or specific functional forms, which easily leads to the major drawback of model mis-specification. In this paper, we aim to alleviate these issues by developing a distribution learning-based weighting method. We first learn the true underlying distribution of covariates conditioned on treatment assignment, then leverage the ratio of covariates\' density in the treatment group to that of the control group as the weight for estimating treatment effects. Specifically, we propose to approximate the distribution of covariates in both treatment and control groups through invertible transformations via change of variables. To demonstrate the superiority, robustness, and generalizability of our method, we conduct extensive experiments using synthetic and real data. From the experiment results, we find that our method for estimating average treatment effect on treated (ATT) with observational data outperforms several cutting-edge weighting-only benchmarking methods, and it maintains its advantage under a doubly-robust estimation framework that combines weighting with some advanced outcome modeling methods.
---
中文摘要：
现有的治疗效果评估加权方法通常建立在倾向评分或协变量平衡的基础上。他们通常对治疗分配或结果模型施加强有力的假设，以获得无偏估计，例如线性或特定的函数形式，这很容易导致模型规格错误的主要缺点。在本文中，我们旨在通过开发一种基于分布学习的加权方法来缓解这些问题。我们首先了解以治疗分配为条件的协变量的真实潜在分布，然后利用治疗组的协变量密度与对照组的协变量密度之比作为评估治疗效果的权重。具体来说，我们建议通过变量变化的可逆变换来近似治疗组和对照组中的协变量分布。为了证明我们方法的优越性、鲁棒性和通用性，我们使用合成和真实数据进行了大量实验。从实验结果中，我们发现我们用观测数据估计治疗平均疗效（ATT）的方法优于几种前沿的仅加权基准方法，并且在结合加权和一些先进的结果建模方法的双稳健估计框架下保持了其优势。
---
分类信息：

一级分类：Computer Science 计算机科学
二级分类：Machine Learning 机器学习
分类描述：Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文（有监督的，无监督的，强化学习，强盗问题，等等），包括健壮性，解释性，公平性和方法论。对于机器学习方法的应用，CS.LG也是一个合适的主要类别。
--
一级分类：Economics 经济学
二级分类：Econometrics 计量经济学
分类描述：Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论，微观计量经济学，宏观计量经济学，通过新方法发现的经济关系的实证内容，统计推论应用于经济数据的方法论方面。
--
一级分类：Statistics 统计学
二级分类：Machine Learning 机器学习
分类描述：Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文（监督，无监督，半监督学习，图形模型，强化学习，强盗，高维推理等）与统计或理论基础
--

---
PDF下载：
-->

Weighting-Based_Treatment_Effect_Estimation_via_Distribution_Learning.pdf
大小:(911.97 KB)

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

大多数88

2022-5-16 16:20:53

通过分布学习进行基于权重的治疗效果评估预印本北京清华大学海淀区东城张项目管理学院，Chinazhangdc18@mails.tsinghua.edu.cnKunpeng马里兰州马里兰大学帕克学院罗伯特·H·史密斯商学院，USAkpzhang@umd.eduJanuary2021年7月1日总结了治疗效果评估的现有加权方法，这些方法通常建立在倾向评分或协变量平衡的基础上。他们通常对治疗分配或结果模型施加强有力的假设，以获得无偏估计，如线性或特定函数形式，这很容易导致模型规格错误的主要缺点。在这篇论文中，我们旨在通过开发一种基于分布学习的照明方法来缓解这些问题。我们首先了解治疗分配条件下协变量的真实潜在分布，然后利用治疗组的协变量密度与对照组的协变量密度之比作为评估治疗效果的权重。具体而言，我们建议通过变量变化的可逆转换来近似处理组和对照组中的协变量分布。为了证明我们方法的优越性、鲁棒性和通用性，我们使用合成和真实数据进行了扩展实验。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-5-16 16:21:07

从实验结果中，我们发现，我们用观察数据估计治疗平均治疗效果（ATT）的方法优于几种仅采用边缘加权的基准测试方法，并且在结合了加权和一些先进的结果建模方法的双重稳健估计框架下保持了其优势。关键词观察研究·加权·分布学习·治疗效果评估n1简介随机对照实验作为一种帮助许多领域的研究人员了解给定治疗的因果效应的方法，已变得越来越有吸引力。例如，企业投资A/B测试，看看某个主页布局是否会吸引更多流量。营销人员设计随机实验，测试特定激励计划的有效性，以留住客户并增加收入。在医疗保健和社会学领域，科学家希望了解技术获取和进步对人类福祉的影响，他们通常通过随机实验进行irA预印本研究——2021年1月7日。一般来说，这些随机d实验设计表明，治疗组和对照组在所有背景变量方面都随机不同。这反过来又使研究人员能够衡量治疗对特定结果变量的因果影响。然而，一个主要的挑战是现场实验的成本，这往往是昂贵的，有时对参与者或平台有害。此外，在许多情况下，跑步是不可能的。例如，如果我们担心某些治疗的负面影响，例如药物、烟草烟雾或酒精，那么故意将一组人分配并暴露于这种治疗是不道德的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-5-16 16:21:17

因此，研究人员必须开发新技术，利用收集的观测数据来评估治疗效果。现有方法和挑战随机现场试验的替代方法是使用观测数据的各种计算方法，主要包括回归、拟合和加权。在回归模型中，研究人员调整与治疗和结果变量相关的混杂变量，以缓解混杂效应。尽管回归模型越来越受欢迎，但它们严重依赖于函数形式（通常是线性形式）的假设，而函数形式并不反映大多数现实情况。匹配和加权方法是通过平衡治疗组和对照组的协变量来解决观察性研究中的内生性问题而开发的方法。虽然匹配方法不能充分利用所有数据，但加权通过为所有个体分配不同的权重来克服这一局限性，以便所有个体都可以使用[1]。匹配和加权都得到了很好的研究，以尽可能接近地复制随机对照实验，它们的受欢迎程度反映在统计学、经济学、政治学、社会学和商业等学科的分散研究中。目前治疗效果评估的加权方法通常建立在倾向评分或协变量平衡的基础上。1983年，Rosenbaum和Rubin引入了倾向评分，该评分将所有协变量汇总为一个标量，以表示根据观察到的协变量进行治疗分配的概率[2]。用于治疗评估的一种典型的基于倾向评分的加权方法是治疗加权的逆概率（IPTW）[3]，理论上已证明该方法会导致

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群