ATE、LATE、ITT、ATT、ATC 与 PSM
2023-10-12
| 2023-10-28
0  |  阅读时长 0 分钟
type
status
date
slug
summary
tags
category
icon
password

1. Local Average Treatment Effects

因果推断的最终目的就是确认 ATE (Average Treatment Effect)。一般来说,没有操纵就无法估计因果效应。操纵 Treat 就是因,而由于 Treat 导致的平均效应变化,自然就是果,也就是 ATE。追求无偏的的、有效的 ATE 就是因果推断的终极目标。
实验的一般流程就是,将被试分为实验组和对照组,实验组给予操纵,对照组不给予操纵,然后比较不同组别的关键变量变化,也就是测算 ATE,从而推断因果效应。这在实验室实验中是确实可行的,因为在实验室实验中,实验组的被试必然会受到操纵,而对照组的被试则必然接受不到操纵。
然而,实地实验让这个现象发生了变化。以投放广告为例,当我们对实验组进行操纵(投放广告)时,我们无法确保实验组的被试就一定会打开广告并阅读。这时,实验组的被试没有完全接受到操纵,导致实验出现了单侧不遵从 (one-sided non-compliance)。还有一种可能是,对照组的部分被试,可能在无意中从其他渠道看到了这个广告,这时实验就出现了双侧不遵从 (two-sided non-compliance)。
在这种情况下,如果我们不处理实验组和对照组中的污染数据,继续按照操纵时的分组来比较两组间的差异,得出的就不再是 ATE,这显然不是一个干净的因果效应,对于这样侧算出结论称之为 ITT (Intention-To-Treat Effect)。显然,如果实验没有出现不遵从现象,无论是单侧还是双侧的,ATE 就等价于 ITT。
最理想的情况是,我们能够清楚地知道每个被试到底有没有接受到操纵,然而在大多数情况下这并不可行。在这种情况下,一个次优解就是估计 LATE (Local Average Treatment Effect),在有的书籍和论文中,也将其称为 Complier Average Causal Effect。

1.1. 单侧不遵从时估计 LATE

现在,我们假设实验组和对照组各有 100 名被试。实验组中,有 80 名被试真正的接受到了操纵,而剩下的 20 人虽然在实验组,却没有实际受到操纵。在实验结束后,实验组的 DV 增加了 50,而对照组则没有变化。DV 不变
Type of Subjects
Treatment Outcome Increase 50
Control Outcome Unchanged
Never-Takers
20
20
Compliers
80 (really-treated subjects)
80
如果这时,我们新增一个假设:实验组中没有接受到操纵的人(20 人),他不论被分配到实验组还是对照组,他都不会接受操纵。如果我们认为实验组和对照组是相似的,那么在对照组中也应该有 20 个这种人,这 40 人在实验组和对照组的表现都是一样的,他们对于关键变量的变化没有贡献。在这种情况下,

1.2. 双侧不遵从时估计 LATE

现在,除了实验组有人没有接受到操纵,对照组还有一些人反而受到了操纵。在这种情况下估计 LATE 还要在新增一个假设,也就是人群中没有叛逆者 Defiers。叛逆者 Defiers 指的是,他们被分到实验组就不接受操纵,被分到对照组就寻求机会去接受操纵。
实验组 / 给予操纵
对照组 / 无操纵
实际接受操纵
Compliers
Always-Takers
实际未接受操纵
Never-Takers
Compliers
现在,我们假设实验组和对照组各有 100 名被试。实验组中,有 80 名被试真正的接受到了操纵,而对照组中有 10 人受到了操纵,这时人群中的分布开始复杂起来了。注意,实验组和对照组的人群分布一定是镜像的,因为我们认为这两个组别是相似的。
Types of Subjects
Treatment Outcome Increase 50
Control Outcome Unchanged
Defiers
0
0 (really-treated subjects)
Never-Takers
20
20
Compliers
70  (really-treated subjects)
70
Always-Takers
10  (really-treated subjects)
10  (really-treated subjects)
在这种情况下,

1.3. 使用工具变量估计 LATE

在实验中,我们实际想知道的自变量是是否接受治疗,这是我们的 X,而 Y 是我们的因变量,也就是我们关注的关键被解释变量。如果存在不遵从现象,我们的实验分配 Z 就不再与是否接受治疗 X 等价,这时我们也可以将 Z 视为工具变量。因为导致 ITT 与 ATE 不等价的实际原因是,我们遗漏了变量:被试是否真正接受到操纵。
如果我们没有办法知道被试是否真正接受到操纵,我们也可以退而求其次,通过 ITT 来估计。我们知道,LATE 与 ITT 之间的关系可以表达为 。不难发现,当 ITT 等于 0 时,LATE 也将等于零。换言之,如果 ITT 的估计结果不能拒绝原假设,那么 LATE 也将是显著的。同时 LATE 总是比 ITT 要大一些。
在鼓励设计 Encouragement Designs 中,估计 LATE 是必要的。一种情况是,将被试人为的区分为实验组和对照组可能是不道德的,这时会通过激励措施来鼓励被试接受操纵,也就自然的导致了自选择问题。在这种情况下,人群中必然存在着 Compliers、Always-Takers 和 Never-Takers。也因此,在这种情况下估计 LATE 是必要的,并设计下游实验 Downstream Experiments 来确保假设的成立。
最后,确认 Compliers 的一个简单方式就是安慰剂 Placebo-Controlled Design。比如在投放广告邮件时,可以向控制组投放一个不含油广告内容的邮件,这样就能对照组中寻找 Compliers。在前提假设,邮件内容不影响被试是否打开邮件,成立的情况下,我们有理由认为,对照组中接受安慰剂的被试是 Compliers。

2. ATE、ATT、ATC 与 PSM

ATE 就是我们要观测的终极变量,但是由于种种原因,我们很难观测到 ATE。除了之前提到的 LATE 还有一个办法就是结合 PSM 来估计 ATT 和 ATC。ATE 是所有被试(包括实验组的和对照组的)在操纵前后的平均差异;ATT 是实验组的被试在操纵前后的平均差异;而 ATC 则是对照组的被试在操纵前后的预期差异。当时实验是随机的,且所有被试正确的遵从了给予他们的操纵,那么 ATE、ATT 与 ATC 三者之间是等价的,然而在实践中这三者将具有差异。
在这个模拟数据集中,值得注意的是每个人接受操纵的概率 P 是不等,受到控制变量 X2 的正向影响。换言之,每个个体进入对照组还是进入实验组并不是随机的。
通过 PSM 计算倾向得分并进行逆概率加权,有三种加权方式。第一个是最常用的加权方式,目的是 ATE。在这种情况下,我们不关心个体在对照组还是实验组,而是想知道整体的处理效应。因此,对于实验组的个体用 来衡量,对于对照组的个体则是 来衡量, 的实际含意就是,一个个体进入实验组或对照组的条件概率。第二种就是对于 ATT,我们只关心实验组的个体,因此我们通过逆概率加权来将对照组的个体与他们相匹配。实验组中个体的加权依然为 1,而对照组中个体的权重变为了 。-1 的目的是为了不调整实验组的权重,因为逆概率加权后的权重总是大于一。类似的,在计算 ATC 时,我们只关心对照组的个体,因此对照组的个体权重依然为 0,实验组中的个体权重则变为
ATE 的估计系数在尽可能的接近 1,因为这是因为的真实模型是 服从标准正态分布,因此均值为 0,而 的真实影响,就是 1。而 ATT 和 ATC 与 1 相比,约有 0.5 幅度的上下波动,这是由于 P 决定了进入实验组或对照组的真实概率,而 P 的均值正是 -0.5。

参考文章

 
💡
欢迎您在底部评论区留言,一起交流~
 
 
  • 学术相关
  • R-Language
  • 代码
  • Marp: 基于 Markdown 的 PPT 制作 Homebrew 与 Oh My Zsh 安装指南
    • Cusdis
    目录