本人为经管类专业的学生,平时经常从事科研活动,因实证研究的需要,收集、整理和处理了不少数据,同时也自己写了一些实用的stata代码,现在还对毕业论文头疼的同学可以私信本人或在评论区中评论,以下是本人收集的部分数据和代码的简要说明:
公司层面:
①中国A股上市公司三大报表(资产负债表、利润表和现金流量表)
②中国A股上市公司基本信息数据(公司所在行业、成立时间、所属省份/城市、首次上市时间、注册地址、股权/产权性质等)
③中国A股上市公司治理信息(股权集中度(第一/前十大股东持股比例)、董事长和总经理是否兼任(两职合一)、董事会规模、独立董事比例、非执行董事比例等)
④中国A股上市公司专利情况、研发投资金额、无形资产等创新研发数据
⑤中国A股上市公司利息支出等财务费用数据
⑥中国A股上市公司融资约束指标(SA指数、FZ指数、FC指数等)
⑦中国A股上市公司破产风险指标(Z值、O值)
⑧中国A股上市公司治理水平(主成分分析法)、ESG评级、数字化转型、内控质量指标等热点数据
⑨中国A股上市公司投资效率、高质量发展指标、杠杆操纵指标等模型估计数据
宏观层面:
①GDP数据、财政收支、国土面积、固定资产投资增速、经济政策不确定性等国家层面的数据
②各省GDP、各省社会融资规模、各省金融发展程度、各省数字金融发展程度、各省影子银行发展程度、各省市场化指数、各省金融监管程度等省份层面的数据
③行业总营业收入、行业净利润、行业集中度指标等行业层面的数据
代码:
数据整理:
①变量批量贴标签、命名
②时间变量的处理(年度数据、半年度数据、季度数据)
③字符串数据批量转化
④行业/省份变量处理
⑤长宽型数据转化
数据清洗:
①剔除ST、*ST样本
②剔除特殊行业样本
③缺失值处理
基准回归(主回归):
①固定效应(个体固定效应、时间固定效应、行业/省份/城市时变固定效应)
②异方差稳健标准误、聚类标准误
③控制变量分组标记
④回归命令、回归模型(DID、广义DID、多时点DID、随机效应)的选择
稳健性检验:
①工具变量回归
②平行趋势检验(包含画图代码)
③安慰剂检验(包含画图代码)
④PSM倾向性得分匹配
⑤动态面板GMM估计
机制检验:
①中介效应的实现及其他检验模型
异质性分析:
①调节效应的实现
②分样本回归
以上只是列出了一些常见的数据和代码,还有不少特殊的数据和代码没有展示出来,因本人过去研究领域的局限,无法涉及各个方面的数据,若以上没有你想要的数据和代码,也可以私信本人,可为你提供数据查找和整理的服务,一些需要复杂的模型进行估计的数据也可以帮你进行计算,欢迎交流!