注意:此数据是老师带领我们课题组一起弄的,数据内容均来源于官方,和官方内容保持一致!此外,我们课题组一直关注此类数据,并应用此类数据进行过多次研究,截至2025,该数据官方更新至2023年。目前网上有一些非常不负责任的人,号称有2024年数据的,官方都没更新,也不知道他的数是哪来的,估计连同他别的年份数据也都是不真实的,数据对于科研是非常重要的,大家一定注意甄别!我们的数据是课题组自用数据,已有成果产出,是经过验证的真实数据,大家可以放心使用!
1.资料名称:2023-2001年上市公司企业数字技术赋能数据、企业数字赋能
2.测算方式:参考C刊《当代财经》耿景珠(2023)老师的做法,使用杜明威等(2022)在
机器学习下的词频-逆文本频率(TF-IDF)方法,以期更为精确地刻画中国企业数字赋能情况。具体计算公式如下图。本文将关键词w的逆文本频率(IDF)作为权重,lnNt[(nt (w)+1) ]代表在第t年包含关键词w的年报中w的逆文本频率,Nt表示本文搜集的第t年上市公司年报总数,nt(w)则代表第t年包含关键词w的年报数量。在此思路下,若关键词w仅出现在少数上市公司的年报当中,则关键词w的IDF越高,也意味着此类数字技术具有较高的差异化特征,反之亦然,具体如下图所示
3.资料范围:6万多个样本,5598家企业,包括原始数据词频、计算代码和最终计算结果。
4.参考文献:
耿景珠,杜明威,刘文革.企业数字赋能与全球价值链嵌入[J].当代财经,2023,(08):122-133.DOI:10.13676/j.cnki.cn36-1030/f.2023.08.005.
我们课题成员始终坚持求真务实的学术态度,不善用夸大的语言进行营销。参与本论坛的初衷在于搭建开放的学术交流平台,与各位同仁分享阶段性研究成果,共同进步。在此特别强调:我们坚决维护知识产权,所有资料严禁以任何形式进行转售。愿与大家共建良性学术生态,谨祝各位在探索真理的道路上收获丰硕成果!