stata怎样统计在同一个ID内的符合要求的数据出现的次数

3910

收藏 2022-04-19

大神们，我想以ID为分组，统计在在每个ID内Sewagecharge为1的个数。但是我输入代码bysort ID :egen frequency_2=count( Sewagecharges)并没有达到我要的结果。不知道有哪位网友可以指出来错误，或者提出更好的建议。

附件列表

1.png

原图尺寸 23.65 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

www334455

2022-4-21 09:45:14

检查下ID的数据类型，看都是标记红色的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

shsxhd

2022-4-24 16:14:26

试试count(Year)可否？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Xiaobai123.

2022-5-2 09:49:21

www334455 发表于 2022-4-21 09:45
检查下ID的数据类型，看都是标记红色的

解决了！！！谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Xiaobai123.

2022-5-2 09:49:45

shsxhd 发表于 2022-4-24 16:14
试试count(Year)可否？

可以的，就是这么操作了，我那个数据类型不太对

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Janice.zou

2023-2-17 08:08:25

我个人使用的是2019年ind数据库，使用这个命令：egen family_size=count(hhid),by(hhid)没有使用以下方法计算家庭规模的原因：
1、没有使用pline或者pline_order
例如hhid为2013000129的家庭，家庭规模是5个人，家庭成员的pline的值分别是1、2、31、32、33，pline_order的值分别是1、2、21、22、23，如果使用egen family_size=max(pline)这个命令，会得到结果33，如果使用egen family_size=max(pline_order)这个命令，会得到结果23，但是实际家庭规模是5（因为2013000129出现次数为5次），命令结果与实际结果有出入；
2、hh家庭库里面也有家庭规模
hh库中有两个问项：a2000 家庭成员数量（新访），a1111 新增家庭成员数量，但是变量中存在缺失值，如果将二者相加可以得到家庭规模，但是家庭规模也会存在缺失值。
综上，不管是从逻辑角度还是缺失值角度，用count计算hhid出现次数来计算家庭规模最好。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群