本数据收集2000-2020年的数据,由于指标的计算和回归需要用到上一年的数据,实际投资效率结果为2002-2020 目前关于上市公司投资效率的计算主要时
Richardson(2006)残差模型,以及后续学者对其模型进行的改进,例如
刘慧龙(2014)通过选定国内上市公司指标计算投资效率(
图2中模型1)(主要采用营业收入增长率代替Richardson模型中的托宾Q),同样在其
稳健性测试(图2中模型2)部分基于“完美市场假设”,认为企业投资仅取决于企业面临的投资机会,
并分年度和分行业回归估算投资效率【刘慧龙(2014)、陈运森(2019)等采用销售收入增长率作为投资机会的替代变量】。此外,对企业
过度投资或
投资不足的划分,学者们也有不同观点,主流是Richardson(2006)残差模型估算的残差大于0为过度投资,残差小于0为投资不足,而chen(2011)的文章认为企业的投资存在合理区间,因而采用新的残差模型(图2中模型3)
分别年度和分行业估算投资残差,并按照年度将其四等份,其中低于第25百分位为投资不足,高于第75百分位为过度投资。
1.变量计算【参考刘慧龙(2014)、陈运森(2019)】
陈运森(2018)在文中采用了三种模型衡量企业的投资效,
(1)参考陈运森(2018)的研究在刘慧龙(2014)Richardson(2006)模型的基础设定模型1
(2)
常用于稳健性测设基于完美市场假设和参考chen(2011)的研究设定模型2、模型3
2.数据说明
原始数据:公司文件、资产负债表、现金流量表、利润表等原始文件的年末数据2006-2019;
为了数据演示,excel变量标枪主要是【文字】标签,删除了【字母+数字】标签;
数据格式:报表数据为excel,中间过程及结果为dta;
数据处理:
1)从公司文件提取“是否STPT”、“是否A股”、“是否ab股交叉”等信息
2)命令涉及
为了便于理解公式,有较多的文字辅助说明命令的意思
原始数据整理:excel表格导入,文字变量的处理(证券代码、年份的提取),数据合并,行业提取;
样本的筛选:保留A股公司,剔除ST、PT、金融业公司,连续变量的缩尾
面板数据的筛选:剔除观测期间存在样本缺失的公司,以及保留连续三年以上有观测值的样本,便于自变量的滞后回归。
指标估算:投资效率的估算,过度投资或投资不足虚拟变量的设置,按照年度提取分位数等
3.附件展示
特别说明:实际数据期间是2006-2019,由于指标计算(增长率)需要用到上一年的数据,因此计算投资效率前去掉缺失值时会去掉2006年,而投资效率计算也要用到上一年的数据(上年投资支出),因此,实际有投资效率结果的年份是2008-2019
3.下载链接
为了方便下载和后续更新,已连接的形式存在而不是压缩文件
补充内容 (2020-10-30 22:05):
另有上市公司基础数据整理代码,包含大部分基础数据
https://bbs.pinggu.org/thread-8678554-1-1.html