全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1184 2
2025-06-13
原文发表在知乎上:
调查数据处理中的职业编码转换 - maderia的文章 - 知乎https://zhuanlan.zhihu.com/p/1906281037652272152
一、背景
[size=1.1em]在社会科学研究中,职业分类是社会分层、代际流动、职业获得等研究领域的核心分析变量。然而,当前调查数据中并存着多种职业编码体系,包括国际劳工组织制定的 ISCO(International Standard Classification of Occupations,ISCO) 系列(如 ISCO-68/ISCO-88/ISCO-08)、用于阶层分析的 EGP (Erikson-Goldthorpe-Portocarero)框架、衡量 国际职业社会经济指数(International Socio-Economic Index,简称ISEI),以及我国自主制定的中国标准职业分类代码(Chinese Standard Classification of Occupations,简称CSCO)等。这些编码体系因分类逻辑、应用场景的差异,常面临编码转换难题。

本文将简要介绍国内外常用的职业编码,介绍如何用 Stata 软件实现不同职业代码的转换。文章会详细说明中国标准职业代码(CSCO)和国际标准职业分类(ISCO)之间如何对应,以及怎样把 ISCO 编码换算成国际社会经济指数(ISEI),还会附上具体的操作步骤和实际案例。


二、主要职业代码简介
(一)国际标准职业代码(ISCO)
[size=1.1em]国际标准职业分类(International Standard Classification of Occupations,ISCO)由国际劳工组织(ILO)发布,旨在通过提供统一框架以获取可供国际比较的职业数据。其分类方法采用从大类到单元类的层级结构,从技能水平和技能专业化两个对维度职业进行分组。大类用1位代码表示,中类用2位,小类用3位,单元类用4位。每个组都有标题和代码数字,并附有范围说明。最新版本为2008年发布的ISCO-08,ISCO-58、ISCO-68、ISCO-88等版本 。


(二)国际经济地位指数(ISEI)
[size=1.1em]国际职业社会经济指数(International Socio-Economic Index,简称ISEI)由 Ganzeboom 等人 (1992)在邓肯社会经济地位指数(Duncan's SEI)基础上改进而来,是一种基于职业平均受教育水平和收入计算的连续性量化指标。ISEI 以连续数值刻画职业的社会经济地位,为职业地位跨国家量化研究提供了有效工具。


(三)EGP阶级框架
[size=1.1em]Erikson-Goldthorpe-Portocarero(简称EGP)职业分类由戈德索普 (Goldthorpe) 等人基于新韦伯主义理论提出,核心思想强调职业在劳动力市场中的结构性差异,以雇佣关系、管理权限及市场能力为划分依据,是社会分层研究中经典的阶级分析框架。与本文介绍的其他职业指标不同,EGP职业代码是定类变量。

其阶层结构以职业为基础,形成多层次分类体系,典型结构包括:

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]







EGP阶层框架,转引自:侯利明,秦广强.中国EGP阶层分类的操作化过程——以中国综合社会调查(CGSS)数据为例[J].社会学评论,2019,7(02):16-26.


(四)SIOPS
[size=1.1em]唐启明国际职业声望量表(Treiman's Standard International Occupational Prestige Scale, SIOPS)是社会学职业分层研究的经典工具,由美国社会学家唐启明 (Donald J. Treiman)在 1977 年出版的《职业声望的比较研究》中构建。该量表通过跨文化的职业声望调查,旨在量化不同社会对职业的普遍评价,揭示职业等级的全球共性。唐启明基于 55 个国家的公众调查数据,让受访者对职业的 “社会体面程度” 和 “受尊重程度” 进行评分,通过因素分析提炼出单一的职业声望维度


(五)中国标准职业代码(CSCO)
[size=1.1em]中国标准职业分类代码(Chinese Standard Classification of Occupations,简称CSCO)是规范我国职业分类的基础性文件,规定了职业的分类结构、类别、代码及说明,适用于普查统计、行政管理及国内外职业信息交流。以从业人员所从事工作性质的相似性为分类依据,将职业划分为大类、中类、小类三层结构,形成逻辑清晰的层次化体系。现行中国职业分类代码为2015年发布的GB/T 6565-2015《职业分类与代码》 。在国内大型社会调查的数据编码中,该国家标准职业代码被广泛采用,包括中国家庭追踪调查(CFPS)、中国综合社会调查(CGSS)等微观社会调查数据库。

八大职业类别及结构

  • 第一大类:党的机关、国家机关、群团和社会组织、企事业单位负责人(如党政机关领导、企业高管)。
  • 第二大类:专业技术人员(如工程师、教师、医生、科学家等需专业技能的职业)。
  • 第三大类:办事人员和有关人员(如行政秘书、书记员、人力资源专员等行政辅助岗位)。
  • 第四大类:社会生产服务和生活服务人员(如营业员、服务员、快递员、社会工作者等服务型职业)。
  • 第五大类:农、林、牧、渔业生产及辅助人员(如农民、渔民、兽医、农业技术员等农林牧渔从业者)。
  • 第六大类:生产制造及有关人员(如工人、技工、质检员、装配人员等制造业岗位)。
  • 第七大类:军人(现役军人及相关军事人员)。
  • 第八大类:不便分类的其他从业人员(暂未明确归类的特殊职业)。


三、不同职业代码的转换
[size=1.1em]由于国内大型社会调查项目在职业编码时主要以《中国国家标准职业代码》(GB/T 6565-2015)为依据,因此常涉及该编码体系与其他国际职业分类系统的转换问题。中国家庭追踪调查(CFPS)项目组已发布关于职业社会经济地位测量指标构建的技术说明 ,并在官方网站提供了职业代码转换的具体命令 。本文主要参照 CFPS 项目组公开的文档与转换指令,先将中国国家标准职业代码(CSCO)转换至国际职业分类标准(ISCO),再通过 Stata 统计软件中的相关命令进一步将 ISCO 代码转换为国际职业社会经济指数(ISEI)。


(一)CSCO 与 ISCO88的转换表
[size=1.1em] 打开中国家庭追踪调查的官网,依次点击文档中心 >数据文档>文本编码。下载职业编码下面的三个文件。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]







https://www.isss.pku.edu.cn/cfps/wdzx/sjwd/1357972.htm

第一个文件是一个excel表格,包含了CSCO与ISCO的对应关系。ISCO_CGSS是CGSS项目组的职业编码转化方案,ISCO88_CFPS是CFPS项目组的转换方案。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]






CSCO与ISCO转换表

第二个文件包含了CSCO、ISCO88、SIOPS和ISEI的转换表。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]






CSCO转换为ISCO88、ISEI、SIOPS

根据CFPS项目组提供的转换表,就可以在任意统计软件中编写相应的转换命令。CFPS项目组也编写了iscoocc命令,实现CSCO至ISCO的转换。在项目组提供的编码中,最重要的时iscoocc.ado文件,该文件包含了具体转换的命令。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]






CFPS2010职业代码code

用记事本打开 iscoocc文件可以发现,该命令实质是依据转换表对不同职业代码值进行替换。需注意的是,iscoocc命令适用于将2009年版国家职业代码(CSCO09)转换为ISCO88。由于现行最新国家职业代码为2015年发布的版本 ,因此使用前需先确认调查数据中采用的国标代码年份。具体可查阅调查项目组的手册,或通过职业编码内容进行核查。GB/T 6565-2015征求意见稿中列出09和15年对照表 ,因此可以参照该表进行转换。正式版本的标准需要购买,只提供pdf文件 ,在转换前可以核查一下是否存在差异。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]






iscoocc.ado

CFPS提供的iscoocc命令虽然可以实现CSCO和ISCO之间的转换,但是并不能直接用于职业代码转换。因为该命令只适合5位数的CSCO职业代码与ISCO88之间的转换,且部分取值和缺失值定义在不同调查中可能不一致。所以需要对ado文件进行简要修改。

可以借助AI工具完成ado文件改写,然后进行人工核验。提示词可参考(以CGSS2005中的相关变量为例):

修改stata中下列ado文件,生成新变量qb09bisco88,将已有变量qb09b的对应值转化为isco88对应值,其中6 7 8 9 997 999 处理为缺失值,剩下根据列表CSCO和ISCO88_CGSS 对应关系转换。原有ado文件代码:(复制iscoocc.ado内容)。下表中第一列使用的编码为qb09b所用编码,ISCO88_CGSS为转化后变量qb09bisco88的编码:(根据需要复制对应转换表)。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]






修改后的ado文件

修改好的ado文件保存到"C:\ado\personal"路径。在stata中运行相关文件即可实现职业代码的转换。修改ado文件方法虽然可以实现相关功能,但还是避免不了人工核查和提示词的调试过程。例如,上面修改后的ado文件就把原先iscoocc改成qb09bisco88了。下面介绍第二种方法,借助现有命令和转换表实现职业编码的转化。


(二)crosswalk命令
[size=1.1em]crosswalk命令是瑞士伯尔尼大学社会学教授Ben Jann开发的Stata命令 (estout输出表格指令也是其开发的 )。根据help文件,crosswalk可以实现ISCO不同年份编码之间的转换,以及ISCO与ISEI/SIOPS/EGP等社会地位测量之间的变换。同时,crosswalk命令还可以实现自定义转换列表和命令,省去上述修改和调试ado文件的繁琐过程。

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]







ISCO与ISEI/EGP/SIOPS等地位指标的转换

[backcolor=rgba(0, 0, 0, 0.1)]
[backcolor=rgba(0, 0, 0, 0.1)]






也可以实现ISCO编码之间的转换

首先安装crosswalk命令和moremata包。

//安装crosswalk命令 ssc install crosswalk, replace //安装moremata(运行crosswalk需要moremata包) ssc install moremata, replace
导入数据,查看职业变量的取值和缺失值。复制csco和isco对应的列表(这里空间有限,仅复制部分表格)。复制之后需要根据数据中的缺失值定义进行简单修改。这里将新定义的转换命令命名为cscoisco08(名字可以自定义)。

use "D:\CGSS\2005\cgss2005_14.dta",clear // 导入数据countcodebook qb09a,t(999)//定义转换表,生成cscoisco08转换指令,即将CSCO转换为ISCO88//添加{},折叠代码{crosswalk define cscoisco08()00        110010        110020        110021        110022        114023        110024        110025        120029        120030        114031        114132        114233        11437   .8   .9   .997 .999 .end        }//添加duplicates(first)选项,如果原值(转换表中第一列)重复,使用第一个出现的转换值crosswalk qb09aisco08 = cscoisco08(qb09a),duplicates(first)//将中层干部、中层领导、生产队长等编为生产经营方面的部门经理或主管(isco88代码1220)replace qb09aisco08 = 1220 if inlist(qb09a,301,302,401,518,601,602,603)//将isco88转换为iseicrosswalk isei = isco88_to_isei(qb09aisco08)//查看iseitab isei
由于CFPS提供的转换表为多对一映射,在使用命令时,需要在最后加上duplicates(first),代表使用第一个出现的对应值。


四、小结
[size=1.1em]不同职业代码之间的转换是分析调查数据的关键环节,本文介绍了国际标准职业代码(ISCO-66/ISCO-88/ISCO08)、国际经济地位指数(ISEI)、中国国家职业代码(CSCO)、EGP 等主流职业编码,详细说明了以 Stata 为例的 CSCO 转化为 ISCO、ISCO 转化为 ISEI 的方法和相关命令(iscogen/crosswalk),并通过实际操作代码和实例展示了具体的转换过程和应用。






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2025-7-23 23:30:40
请问您有GB/T 6565-2015征求意见稿中列出09和15年对照表吗,我现在只有CSCO2015版的代码,想要转成ISCO,cfps中的代码会遗漏一部分
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2025-7-26 11:15:17
LIANG012 发表于 2025-7-23 23:30
请问您有GB/T 6565-2015征求意见稿中列出09和15年对照表吗,我现在只有CSCO2015版的代码,想要转成ISCO,c ...
可以去https://www.cnis.ac.cn/ynbm/gxjsyxxyjs/bzyjzq/gbyjzq/201505/t20150529_19408.html看看,好像可以下载相关文件
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群