数据资产信息披露
持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据
【原创整理,严禁转载,转载必究】
参考文献
[1]徐海伟,刘华.数据资产信息披露与资本市场定价效率——基于股价同步性的分析[J].当代财经,2024,(12):140-152.DOI:10.13676/j.cnki.cn36-1030/f.20241107.002.
[2]李世刚,邵宏彬,方芳,等.企业数据资产信息披露与资本市场定价效率[J].中国工业经济,2025,(07):138-155.DOI:10.19581/j.cnki.ciejournal.2025.07.010.
[3]陈荣达,林祺,金骋路,等.数据资产估值定价与新质生产力发展:演进逻辑与主要挑战[J].财贸经济,2024,45(08):33-51.DOI:10.19795/j.cnki.cn11-1166/f.20240805.006.
计算说明
利用文本分析技术,挖掘上市公司年报内容作为企业数据资产信息披露水平度量范围,构建两项指标。具体而言,本文以大数据技术标准推进委员会和中国信息通信研究院2021 年发布的《数据资产管理实践白皮书(5.0 版)》对数据资产的定义为基准,将“数据资产”和“数据资源”作为种子词汇,利用 Word2Vec 构建相似词集得到“数据资产”相关关键词,统计相似度最高的关键词(大数据、海量数据、数据分析系统、数据共享、数据平台、数据挖掘、数据源、信息资源、知识库)在年报中出现的频次总数,由于该词频总数呈右偏态分布,对数据资产总词频进行加1并取对数化处理得到变量 Dig1,并计算“数据资产”相关关键词词频占当年年报总词频的比例得到变量Dig2。
数据说明
样本选择:全部A股2006-2024年数据
包含两个版本:一份未剔除、一份剔除金融和ST、*ST或PT
注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算
并对连续型变量进行了1%和99%分位数的缩尾处理
每个压缩包都附有初始数据,计算代码,参考文献和最终数据
赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。
再额外赠送超值上市常用分组指标:是否 ST或PT、是否金融业、资产负债率是否大于1、是否沪深A股、
是否北京A股、行业名称、行业代码、所属省份代码、所属省份、所属城市代码、所属城市、分东部地区、中部地区、西部地区、是否高科技行业、是否重污染行业
原创申明作为长期扎根于此的原创数据提供方,我们始终秉持严谨的治学态度。遗憾的是,近期发现部分投机账号对本团队的心血进行像素级抄袭(包括数据及计算文案说明)。
在此郑重提醒广大同仁:学术研究,数据为基。抄袭者可以复制文字,却无法复制数据背后的清洗逻辑与学术洞察。若使用来源不明的盗版数据,可能因数据缺失、错误而导致研究偏误,影响实证结论的可靠性。请务必认准官方唯一渠道,确保您的研究建立在扎实的数据基础之上。
数据截图
分年份数据量统计
描述性统计
2007-2024年上市公司数据资产信息披露指标整理.zip
大小:(54.94 MB)
只需: RMB 69元
马上下载
本附件包括:
- 上市公司基本信息.xlsx
- 代码.do
- 企业数据资产信息披露与资本市场定价效率_李世刚.pdf
- 分组指标.dta
- 分组指标.xlsx
- 数据资产估值定价与新质生产力发展:演进逻辑与主要挑战_陈荣达.pdf
- 数据资产信息披露与资本市场定价效率——基于股价同步性的分析_徐海伟.pdf
- 是否ST或PT.dta
- 结果-剔除金融剔除ST处理.dta
- 结果-剔除金融剔除ST处理.xlsx
- 结果.dta
- 结果.xlsx
- 词频统计.xlsx