1991-2024中国上市公司企业数据资产化
参考何瑛,陈丽丽,杜亚光(2024)的做法,构建上市公司数据资产化指标。
首先,我们基于上市公司年报的文本数据,剔除金融业和保险业的上市公司,加载专业词典和停用词表,筛选非金融行业公司年报,通过jieba分词提取有效中文词汇;匹配自用型(ODA)和交易型(DDA)数据资产关键词,分别统计两类词频并计算总和,其中部分数据资产化识别术语如下:
自用型:“数字设施”,“数字工厂”,“数字设备”,“数字经济”
交易型:“数字平台”,“数字贸易”,“数字认证”,“数字消费”…
分别计算各公司年报中特征术语的绝对出现频次及其占总文本词汇量的相对比重,由于这类数据具有典型的 “右偏性” 特征, 对其进行对数化处理 (即加 1 后取自然对数) , 从而得到刻画企业数据资产化程度的整体指标,包含代码、公司名称、总词数、特征词频次及占比的结构化数据集,为评估企业数字化转型水平、识别数据要素增值路径提供可度量依据,助力释放数据资产的经济价值与战略价值。
[1]何瑛,陈丽丽,杜亚光.数据资产化能否缓解“专精特新”中小企业融资约束[J].中国工业经济,2024,(08):154-173.