全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心
4724 4
2023-11-17
1.依据年份中位数/均值划分 by year <br>
2.总样本的中位数/均值<br>
3.政策实施的前一年的中位数/样本均值,这样比较常见,但是如何写stata代码呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-11-17 15:10:52
要按年份分组并计算中位数和均值,可以使用 Stata 中的 `egen` 命令和 `by` 前缀。
```stata
* 按年份分组并计算中位数和均值
egen median_var = median(variable), by(year)
egen mean_var = mean(variable), by(year)
在上述代码中,将 `variable` 替换为您要计算中位数和均值的变量名称,将 `year` 替换为表示年份的变量名称。这将创建两个新的变量 `median_var` 和 `mean_var`,分别包含按年份分组计算的中位数和均值。
对于 DID(Difference-in-Differences)设计中的异质性连续变量,选择使用中位数或均值进行分组,具体取决于您的研究问题和数据分布。中位数更适合处理偏斜较大的数据,而均值更适合处理对称分布的数据。
要在 Stata 中进行 DID 分析使用 `regress` 命令,并在模型中包含交互项来捕捉处理组和对照组之间的差异。
```stata
* DID 分析
regress outcome treated treated_after treated#treated_after control_vars
在上述代码中,将 `outcome` 替换为您的因变量名称,`treated` 替换为表示处理组的二进制变量名称,`treated_after` 替换为表示政策实施后的时间变量名称,`control_vars` 替换为其他控制变量的名称。交互项 `treated#treated_after` 捕捉了处理组和政策实施后的时间之间的交互效应。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-18 11:00:26
sun_man 发表于 2023-11-17 15:10
要按年份分组并计算中位数和均值,可以使用 Stata 中的 `egen` 命令和 `by` 前缀。
```stata
* 按年份分 ...
谢谢你呀!但是如果根据政策实施前一年的某连续变量的中位数分组,这样该如何写代码呢?不是所有年份的中位数分组。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-24 14:57:14
xsszuel 发表于 2023-11-18 11:00
谢谢你呀!但是如果根据政策实施前一年的某连续变量的中位数分组,这样该如何写代码呢?不是所有年份的中 ...
我有一个想法,请看看是否合适:
1. 只保留 政策前一年 的数据
2. 分组:按指定标准分高低
3. 合并:将第2步分完组的重新合并至原数据集
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-12-1 13:10:57
wtst 发表于 2023-11-24 14:57
我有一个想法,请看看是否合适:
1. 只保留 政策前一年 的数据
2. 分组:按指定标准分高低
谢谢!是这样做的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群