ljd0573741 发表于 2020-10-19 13:06 
关于这个行业问题我还是没弄明白,Nnindcd、Nindcd、sic_men、sicmen、Sic2、Sic2_str、Sicmen_str,这么 ...
关于行业分类变量的详细解答:
1.为了方便查看行业分类各个变量,可以单独保存一份行业分类变量,输入如下代码:
preserve
keep Nnin* Nin* Sic*
save “Industry_type.dta”, replace //生成的行业变量集锦
Restore
2.国泰安提供的原始行业分类变量:
(1)Indcd 行业代码A 0001=金融,0002=公用事业,0003=房地产,0004=综合,0005=工业,0006=商业。
(2)Indnme 行业名称A Finance=金融,Utilities=公用事业,Properties=房地产,Conglomerates=综合,
Industrials=工业,Commerce=商业。
(3)Nindcd行业代码B——2001版证监会行业分类代码。
(4)Nindnme 行业名称B——2001版证监会行业分类名称。
(5)Nnindcd 行业代码C——2012版证监会行业分类代码。
(6)Nnindnme 行业名称C——2012版证监会行业分类名称。
以上六个变量均为字符串格式,1/3/5提供的是英文字符串,2/4/6提供的是中文字符串。
3.根据上述变量,新生成了一些变量:
(7)Sic2——按照制造业C按门类,其他按照大类划分(已经encode转换)
(8)Sic2_str——为Sic2的字符串格式
(9)Sicda——按照证监会2012行业大类进行分类(已经encode转换)
(10)Sicda_str——为Sicda的字符串格式
(11)Sicmen——按照证监会2012行业门类进行分类(已经encode转换)
(12)Sicmen_str——为Sicmen的字符串格式
(13)Sicmen_chg——行业门类代码是否变更(已经encode转换)
(14)Sicda_chg——行业大类代码是否变更(已经encode转换)
4.如何使用上述变量:我猜测你不熟悉的原因在于没有搞清楚什么是行业大类?什么是行业门类?你要知道它们的区分。如果没有弄清楚可以去证监会网站找一下。简单的说,比如C就是大类,C1、C2等就是行业门类。研究中通常的做法是除制造业C采用门类以外(C1、C2等),其他行业采用行业门类(A、B、D等),原因在于制造业公司太多了,划分在一类不够科学。所以,你使用Sic2和Sic2_str是比较好的做法,我一般也采用这种做法——参见黄梅、夏新平(2009)——《南开管理评论》。