1、数据源名称:上市企业-数据资产披露水平数据(2000-2023年)
2、参考文献:
牛彪,于翔,苑泽明,等.数据资产信息披露与审计师定价策略[J].当代财经, 2024(2):154-164.
3、测算方式:
参考牛彪和于翔等(2024)的做法,采用“种子词+Word2Vec相似词扩充”的文本分析方法来测算企业的数据资产信息披露水平。具体步骤如下:
首先,根据《中国信通院2019年发布的《数据资产管理实践白皮书(4.0版)》,“数据资产”被定义为能够为企业创造经济利益的数据资源。基于此,将“数据资产”和“数据资源”作为种子词汇,生成相关的相似词词集
其次,通过深度学习技术和Word2Vec神经网络模型,生成与种子词汇语义相近的相似词集,并仅保留相似度最高的前10个词汇
最后,统计词汇在年报中的频次,并结合以下公式计算企业的数据资产信息披露水平
4、数据介绍:
数据是数字经济时代的基础性资源,也是企业实现高质量发展的关键生产要素。中国信通院发布的《国家数据资源调查报告(2021)》显示,2021年我国数据产量达到6.6ZB,占全球数据总产量的10%,位列全球第二随着大数据的普及和信息化水平的提高,数据资产已经成为企业在现代商业环境中的重要竞争资源,数据资产的管理和披露水平对企业的透明度和竞争力具有重要意义。
5、主要指标:
股票代码 | 公司简称 | 年份 |
全文总词数 | 关键词词频数 | 数据资产信息披露水平 |
数据资产 | 信息资源 | 数据挖掘 |
数据源 | 大数据 | 数据共享 |
海量数据 | 数据平台 | 数据分析系统 |
数据资源 | 知识库 |
6、部分数据截图: