did异质性连续变量如何分组呢？均值还是中位数呢？

xsszuel

4724

收藏 2023-11-17

1.依据年份中位数/均值划分 by year <br>
2.总样本的中位数/均值<br>
3.政策实施的前一年的中位数/样本均值，这样比较常见，但是如何写stata代码呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

sun_man

2023-11-17 15:10:52

要按年份分组并计算中位数和均值，可以使用 Stata 中的 `egen` 命令和 `by` 前缀。
```stata
* 按年份分组并计算中位数和均值
egen median_var = median(variable), by(year)
egen mean_var = mean(variable), by(year)
在上述代码中，将 `variable` 替换为您要计算中位数和均值的变量名称，将 `year` 替换为表示年份的变量名称。这将创建两个新的变量 `median_var` 和 `mean_var`，分别包含按年份分组计算的中位数和均值。
对于 DID（Difference-in-Differences）设计中的异质性连续变量，选择使用中位数或均值进行分组，具体取决于您的研究问题和数据分布。中位数更适合处理偏斜较大的数据，而均值更适合处理对称分布的数据。
要在 Stata 中进行 DID 分析使用 `regress` 命令，并在模型中包含交互项来捕捉处理组和对照组之间的差异。
```stata
* DID 分析
regress outcome treated treated_after treated#treated_after control_vars
在上述代码中，将 `outcome` 替换为您的因变量名称，`treated` 替换为表示处理组的二进制变量名称，`treated_after` 替换为表示政策实施后的时间变量名称，`control_vars` 替换为其他控制变量的名称。交互项 `treated#treated_after` 捕捉了处理组和政策实施后的时间之间的交互效应。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xsszuel

2023-11-18 11:00:26

sun_man 发表于 2023-11-17 15:10
要按年份分组并计算中位数和均值，可以使用 Stata 中的 `egen` 命令和 `by` 前缀。
```stata
* 按年份分 ...

谢谢你呀！但是如果根据政策实施前一年的某连续变量的中位数分组，这样该如何写代码呢？不是所有年份的中位数分组。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wtst

2023-11-24 14:57:14

xsszuel 发表于 2023-11-18 11:00
谢谢你呀！但是如果根据政策实施前一年的某连续变量的中位数分组，这样该如何写代码呢？不是所有年份的中 ...

我有一个想法，请看看是否合适：
1. 只保留政策前一年的数据
2. 分组：按指定标准分高低
3. 合并：将第2步分完组的重新合并至原数据集

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xsszuel

2023-12-1 13:10:57

wtst 发表于 2023-11-24 14:57
我有一个想法，请看看是否合适：
1. 只保留政策前一年的数据
2. 分组：按指定标准分高低

谢谢！是这样做的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群