全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
18686 10
2013-04-14
连老师:
       我在想要做PSM+DID,遇到以下问题向老师请教:
      1.common support假设的结果应该怎么看?这部分在视频中,基本思想理解了。但是具体结果在什么条件下满足假设、在什么条件下不满足假设不太清楚,图中为三种匹配方法现实的common support假设结果。
      2.我做出的结果,现在只有半径匹配,在半径为0.0001时,满足平行假设;最近邻匹配、核匹配的平行假设都无法被满足,这样的结果是否不够稳健?还需要继续调整?(最近补充:调整了一些变量后,半径匹配平行假设不出结果,核匹配平行假设基本都满足,最近邻匹配的平行假设不满足)
     3.我看到老师的其他回复都是用PSM的核匹配后做DID,那么半径匹配后,能做DID吗?(补充:老师,核匹配后后又该怎么做DID?)     
    4.我发现很多匹配后没有倾向得分值,也就没有参与匹配,这是不是因为数据存在缺漏的缘故?要继续下一步的DID,是否应该补齐缺漏数据?(比如用选取替代变量、继续查找数据、多重补漏分析等)
    5.用于PSM的数据需要做无量纲处理(除以均值或者标准差)吗?



附件: 您需要登录才可以下载或查看附件。没有帐号?我要注册
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-4-18 10:40:22
1. 三幅图中,只有核匹配比较满足 Common Support 假设,半径匹配基本上不满足;

2. 那就选用核匹配吧;

3. 理论上是可以的,但由于涉及到权重的问题,写程序还有些障碍,你还是用 diff 命令提供的 核匹配+DID 进行分析吧。

4. 你要看一下匹配变量的详情,应该是匹配变量,即参与 probit 回归的那些变量中存在缺漏值,导致相应行的观察值并未参与回归,也就无法计算出 pscore 了。

5. 无需量纲处理。不知你的变量都是什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-18 12:54:43
arlionn 发表于 2013-4-18 10:40
1. 三幅图中,只有核匹配比较满足 Common Support 假设,半径匹配基本上不满足;

2. 那就选用核匹配吧; ...
1.老师,我查看了数据结果,确实由于数据缺漏造成的倾向得分值无法计算
2.进行无量纲处理的数据是:各地区的(省级)的发电量、原煤产量、布产量等。除去他们的均值做无量纲处理后,结果并无显著变化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-18 13:08:07
arlionn 发表于 2013-4-18 10:40
1. 三幅图中,只有核匹配比较满足 Common Support 假设,半径匹配基本上不满足;

2. 那就选用核匹配吧; ...
老师,还有一个问题向老师请教。
   我现在的一个时间发生的是一个时间段,那么匹配应该拿什么时段的数据来做匹配呢? (我选用的是面板数据)
   比如,一个政策在1990-2000年持续发生了10年,10年之后就结束了。这个政策是有指向性的,所以存在样本选择偏误。那么我应该拿什么时段的时间来做匹配呢?是1990年-2000年,还是这之前和之后的时间段都用于匹配呢?
   匹配之后DID的两个时期应该怎样选择才比较合适呢?能不能新生成一个虚拟变量来反映时期,把1980-1990年这10年看做是基期,定义为0; 把2000-2010年这10年看做是处理后的时期,定义为1,用来做DID?
  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-19 08:47:33
“能不能新生成一个虚拟变量来反映时期,把1980-1990年这10年看做是基期,定义为0; 把2000-2010年这10年看做是处理后的时期,定义为1,用来做DID?”
这个方案可行。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-19 23:07:05
arlionn 发表于 2013-4-19 08:47
“能不能新生成一个虚拟变量来反映时期,把1980-1990年这10年看做是基期,定义为0; 把2000-2010年这10年看 ...
还是继续在这个帖子里面请教连老师吧,方便其他人查看。

Question1:老师看下PSM+DID的基本步骤是不是正确:
Step1:PSM核匹配
Step2:生成时期虚拟变量 t (事件发生前的时期==0;事件发生后的时期==1)
Step3:DID
基本命令:diff outcome_var, t(_treated) p(t) cov(用于产生propensity score的变量) kernel id(id) report             (Note:此处_treated的是第1步PSM的匹配结果)


Question2:无法加入控制变量,因为:
cov(varlist) 选项的解释是 Specifies the pre-treatment covariates of the model. When option kernel is selected these variables are used to generate the propensity score.

这时,即使加了report选项,最后报告的也只是PSM中probit回归的结果。
那么岂不是无法加入控制变量了?我思考了一下,问题是不是这样:
我看到老师在另一个帖子中回复说道:“OLS控制变量只是摆了个pose,没有真正地控制住;但是,PSM做到了”;这主要是由老师在视频中提到的PSM的common support和balance两个假设做到的。
那么,这里PSM的控制变量是不是和我们通常意义上理解的控制变量是有差异的?
OLS的控制变量找到的是被解释变量的影响因素;而PSM的控制变量是事件发生的影响因素。以老师视频中讲到的“上北大与收入的关系”来说。
如果是OLS,我们加入的控制变量是“ 影响这个人收入的因素
如果是PSM,我们加入的控制变量时“影响这个人上北大的因素
两者并不一致。
老师还在另一帖子说:“DID本质上就是OLS”,那么如果我们进行了匹配,是不是基于核匹配的DID就已经和传统的DID有很大差异了,因为传统的DID在存在样本选择偏误的情况下,并没有满足DID所要求的“共同趋势假设”?




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群