常用控制变量和常用分组指标整理
持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据
【原创整理,严禁转载,转载必究】
计算说明
- 公司规模 Size 年总资产的自然对数
- 资产负债率 Lev 年末总负债 / 年末总资产
- 总资产净利润率 ROA 净利润 / 总资产平均余额
- 净资产收益率 ROE 净利润 / 股东权益平均余额
- 销售毛利率 GrossProfit (营业收入-营业成本) / 营业收入
- 销售净利率 NetProfit 净利润 / 营业收入
- 流动比率 Liquid 流动资产 / 流动负债
- 速动比率 Quick (流动资产-存货) / 流动负债
- 现金流比率 Cashflow 经营活动产生的现金流量净额 / 总资产
- 应收账款占比 REC 应收账款净额 / 总资产
- 存货占比 INV 存货净额 / 总资产
- 固定资产占比 FIXED 固定资产净额 / 总资产
- 无形资产占比 Intangible 无形资产净额 / 总资产
- 有形资产占比 Tangible (资产总额 - 无形资产净值 - 商誉净额) / 总资产
- 营业收入增长率 Growth 本年营业收入 / 上一年营业收入-1
- 总资产增长率 AssetGrowth 本年总资产 / 上一年总资产-1
- 投资水平 Invest1 构建固定资产、无形资产和其他长期资产支付的现金 / 期初总资产
- 投资水平 Invest2 (构建固定资产、无形资产和其他长期资产支付的现金 + 取得子公司及其他营业单位支付的现金净额) / 期初总资产
- 投资水平 Invest3 (构建固定资产、无形资产和其他长期资产支付的现金-处置固定资产、无形资产和其他长期资产收回的现金净额) / 期初总资产
- 投资水平 Invest4 (构建固定资产、无形资产和其他长期资产支付的现金 + 取得子公司及其他营业单位支付的现金净额 - 处置固定资产、无形资产和其他长期资产收回的现金净额 - 处置子公司及其他营业单位收到的现金净额) / 期初总资产
- 是否亏损 Loss 当年净利润小于0取 1,否则取0
- 董事人数 Board 董事会人数取自然对数
- 独立董事比例 Indep 独立董事除以董事人数
- 两职合一 Dual 董事长与总经理是同一个人为1,否则为0
- 第一大股东持股比例 Top1 第一大股东持股数量 / 总股数
- 前三大股东持股比例 Top3 前三股东持股数量 / 总股数
- 前五大股东持股比例 Top5 前五股东持股数量 / 总股数
- 前十大股东持股比例 Top10 前十股东持股数量 / 总股数
- 股权制衡度 Balance1 第二大股东持股比例 / 第一大股东持股比例
- 股权制衡度 Balance2 第二到五位大股东持股比例的和 / 第一大股东持股比例
- 股权制衡度 Balance3 第二到十位大股东持股比例的和 / 第一大股东持股比例
- 股权赫芬达尔指数 Herfindahl3 公司前3位大股东持股比例的平方和
- 股权赫芬达尔指数 Herfindahl5 公司前5位大股东持股比例的平方和
- 股权赫芬达尔指数 Herfindahl10 公司前10位大股东持股比例的平方和
- 两权分离 Seperate 实际控制人拥有上市公司控制权比例 - 实际控制人拥有上市公司所有权比例
- 账面市值比 BM 账面价值 / 总市值
- 市净率 PB 每股价格 / 每股净资产
- 托宾Q值 TobinQ (流通股市值+非流通股股份数×每股净资产+负债账面值) / 总资产
- 是否国有企业 SOE 国有控股企业取值为1,其他为0
- 上市年限 ListAge ln(当年年份-上市年份+1)
- 公司成立年限 FirmAge ln(当年年份-公司成立年份+1)
- 上市年份 ListedYear 上市年份
- 公司成立年份 EstablishYear 成立年份
- 机构投资者持股比例 INST 机构投资者持股总数 / 总股本数量
- 管理层持股比例 Mshare 董监高持股数量 / 总股本数量
- 经营费用率 Ofee (管理费用+销售费用) / 营业收入
- 管理费用率 Mfee 管理费用 / 营业收入
- 总资产周转率 ATO 营业收入 / 平均资产总额
- 大股东资金占用 Occupy 其他应收款净额 / 总资产
- 是否四大 Big4 公司经由四大(普华永道、德勤、毕马威、安永)审计为1,否则为0。
- 审计意见 Opinion 若公司当年的财务报告被出具了标准审计意见,则取值为1,否则为0
- 审计费用 AuditFee 审计费用取自然对数
- 员工人数 Employee 员工人数取自然对数
- 管理层平均年龄 TMTAge 董监高年龄的平均数
- 产融结合 Bank 是否持有银行股份
- 产融结合2 FinInst 是否持有其他金融机构股份
- 管理层女性比例 Female 管理层女性人数 / 管理层总人数
- 董监高是否具有金融背景 FinBack 现任的董监高中是否有人具有金融背景(如监管部门、银行、证券、期货、投资公司、信托等等)
- 董监高是否具有海外背景 OverseaBack 现任的董监高中是否有人具有海外背景(包括曾经与现在的海外求学、海外任职)
- 管理层前三名薪酬 TMTPay1 前三名高管薪酬总额的自然对数
- 管理层总薪酬 TMTPay2 高管薪酬总额的自然对数
- 当年是否ST或PT 当年是否ST或PT 当年ST或PT为1,否则为0
- 样本区间内是否ST或PT 样本区间内是否ST或PT 样本区间内ST或PT为1,否则为0
- 样本区间内是否退市 样本区间内是否退市 样本区间内退市为1,否则为0
- 是否当年上市 是否当年上市 当年上市为1,否则为0
- 是否属于上市前 是否属于上市前 该观测值属于上市前为1,否则为0
- 上市板块 上市板块 深证A股、上证A股、北证A股、创业板、科创板。
- 金融业 金融业 金融业为1,否则为0
- 制造业 制造业 制造业为1,否则为0
- 沪深上市 沪深上市 沪深上市为1,否则为0
- 北京上市 北京上市 北京上市为1,否则为0
- 资不抵债 资不抵债 负债大于资产为1,否则为0
- 是否国有企业 SOE 国有控股企业取值为1,其他为0
- 上市年份 ListedYear 上市年份
- 成立年份 EstablishYear 成立年份
- 退市年份 DelistedYear 退市年份
- 省份 Province 注册地所在省份
- 城市 City 注册地所在城市
- 办公地经度 Lng 办公地经度
- 办公地纬度 Lat 办公地纬度
- 行业代码 Industry1 证监会2012年行业分类
- 行业代码 Industry2 证监会2012年行业分类,制造业取两位代码,其他行业用大类
- 融资约束1 SA SA指数,绝对值越大(由于SA值是负数,其实是SA值越小),融资约束程度越严重。
- 融资约束2 WW WW指数,越大,融资约束越大
- 东部地区 East 东部地区为1,否则为0
- 西部地区 West 西部地区为1,否则为0
- 中部地区 Mid 中部地区为1,否则为0
- 高科技行业1 HighTech_1 高科技行业为1,否则为0。
- 高科技行业2 HighTech_2 高科技行业为1,否则为0。
- 重污染行业1 Pollute_1 重污染行业为1,否则为0。
- 重污染行业2 Pollute_2 重污染行业为1,否则为0。。
- 重污染行业3 Pollute_3 重污染行业为1,否则为0。
- 沪深上市 沪深上市 在上海证券交易所或深圳证券交易所上市为1,否则为0
- 北京上市 北京上市 在北京证券交易所上市为1,否则为0
- 资不抵债 资不抵债 总负债大于总资产为1,否则为0
数据说明
样本选择:全部A股2000-2022年数据
包含三个版本:
一份未剔除
一份剔除金融和ST、*ST或PT、剔除资不抵债、剔除上市前样本
一份剔除并做缩尾处理
每个压缩包都附有初始数据,计算代码,参考文献和最终数据
赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。
数据截图
分年份数据量统计