全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
15991 2
2015-11-23
请问,一个变量中,同一个公司同一个年份有多个观测值,不同观测值含有不同的字符,我需要统计相同公司相同年份中,这个变量里共有几种不同的字符。

查到了codebook这个命令,但它只是将计数反馈出来。可不可以gen一个新变量,将codebook的计数结果赋值给这个新变量?
谢谢了!!


如下图,想要统计同一个公司同一个年份中,Ananm中有多少个相同的名字。希望有个命令能够直接统计出来并显示在data中,因为数据比较多。
想要统计Ananm中有几个不同的人,同一个公司同一个年份中
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-27 00:09:45
相同的数字比较容易,字符的计数统计就没遇到过,还请牛人指教。但我想,能不能,用encode,把相同的字符赋值为一个数字,再去统计相同数字的个数呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-9-18 15:18:48
有好几个命令结合起来用的:
第一步:将Ananm变量中的字符串逐个逐个substr出来
首先,找到Ananm中每个“,”的位置。这个变量中包含“,”,多个字符串,即使是同样的多个字符串加上逗号,也不一定是相等的。这里需要使用一个计数(找到位置)的命令ustrpos,找到变量中每个“,”的在字符串中的位置:gen xx=ustrpos(),具体参见help手册;
其次,将Ananm中每个字符串(人名)分离出来。gen的xx是逗号在变量Ananm每个观测值中的位置,是int型数值,根据这个数字用substr()命令,把每个名字提取出来。
第二步:识别同公司、同年度相同名字的个数:使用bys st(year): gen   if 命令。
搞定。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群