各位老师、前辈们好,本stata萌新有小问题求助,如有规范不严谨的地方请多指正:
我有一个用户截面数据,其中包含该用户加入与冻结时间,现在想统计出某个年份(比如2018年)逐月的留存用户数量。比如一个用户2018年1月加入,2018年6月冻结,那么2018年6月就包含他这么一个留存用户,2018年7月就没有。以此统计所有用户的数量和。冻结时间为空的即为未被冻结。
以下是我的data sample:
member_id,effect_y,effect_m,freeze_y,freeze_m
151319,2015,8,,
207537,2015,11,2018,1
834196,2016,8,2018,6
1777529,2017,8,2018,9
1060302,2016,11,,
1559083,2017,5,,
386461,2016,3,2019,12
415216,2016,4,,
720988,2016,7,,
483107,2016,4,2020,1
350078,2016,3,,
688124,2016,7,2019,3
924060,2016,10,2020,3
203164,2015,11,2019,12