小弟正在处理一份panel data,需要每年对于不同的行业进行分组求平均数,现在只会用这个
egen meanindustry=mean(industry),by(year)
但是主要行业分为三个组别,{1,2,3},这样的话我只会
egen meanindustry1=mean(industry) if industry==1,by(year)
然后再把三个meanindustry合并成一个变量,不知道哪位高手有更加简单的方法?感激不尽!
蓝色 发表于 2012-11-15 13:27
bysort year industry: egen meanindustry=mean(x)
大神,我初学stata,这个程序没看太懂,麻烦能不能解释一下。楼主的egen meanindustry1=mean(industry) if industry==1,by(year),这个不是已经求出了组别1历年的平均值了吗?楼主为什么还要再把三个meanindustry合并成一个变量呢?是变量太多的原因?
lianzhongren 发表于 2015-6-29 13:06
大神,我初学stata,这个程序没看太懂,麻烦能不能解释一下。楼主的egen meanindustry1=mean(industry) i ...
bysort指根据某一变量进行分类,此命令中bysort year industry表示根据时间(年份)将industry进行汇总。例如2018年有行业1、2、3,那么就根据相同的时间进行运算。 egen表示生成变量。mean表示取平均数,即2018年的行业1、2、3的数值进行平均。同样的也可取求和sum之类的……