全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
18328 6
2023-07-19
要在Stata中按年份和省份计算平均值,你可以使用`collapse`命令结合`by`子句。假设你有一个名为`data`的数据集,包含以下列:`year`(年份列)和`province`(省份列),以及其他数值型变量列。下面是一个示例代码:
```stata
collapse (mean) var1 var2, by(year province)
```
在上面的代码中,将`var1`和`var2`替换为你要计算平均值的变量列名。通过指定`(mean)`选项,`collapse`命令将按指定的年份和省份分组,并计算平均值。
执行该命令后,Stata将生成一个新的汇总数据集,其中包含按年份和省份计算的平均值。你可以使用`browse`命令查看新数据集,或使用其他需要对结果进行进一步分析的Stata命令。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-7-19 10:35:31
我一般用bysort year province:egen xm=mean(x)来求,然后再duplicates drop year province,force后查看结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-7-19 10:35:35
我一般用bysort year province:egen xm=mean(x)来求,然后再duplicates drop year province,force后查看结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-7-20 10:28:30
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-10-16 09:23:39
想问一下按省份求中位数是什么命令呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-6-26 10:40:15
在Stata中,如果你想要按照年份(year)和省份(province)来计算某个变量(比如叫做var1)的平均值,你可以使用`collapse`命令。这里是如何操作的一个例子:

```
collapse (mean) var1, by(year province)
```

在这个命令中,“(mean)”告诉Stata你希望它计算平均数;而“by(year province)”则指定了按照哪两个变量来分组。

但是,如果你的数据集中的每个省份和年份的组合都有多条记录(即数据是重复的),那么在使用`collapse`命令之前,你需要确保你的数据是排序好的。你可以先用`sort year province`命令对数据进行排序。如果数据中包含缺失值,你还需要确定如何处理这些情况。

如果你想同时计算多个变量的平均值,比如var1和var2,你可以这样写:

```
collapse (mean) var1 var2, by(year province)
```

执行这个命令后,你会得到一个新的数据集,其中包含了每个省份每年对应的var1和var2的平均值。如果想要查看结果,可以使用`list`或者`summarize`等命令。

如果你在处理大型数据集时遇到内存不足的问题,你可能需要考虑分批进行计算或优化你的数据存储方式(例如使用更节省空间的数据类型)。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群