全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
52 0
2026-02-25
【数据简介】
本数据基于中国A股上市公司年度报告的文本挖掘,统计年报中数智
化相关关键词(涵盖"B2B"至"语义搜索"等数十个核心词汇,覆盖
数字经济、人工智能、大数据、云计算、物联网、区块链等领域)的
出现频次,并通过对数变换构建企业数智化程度指标 LnDig,全面衡
量A股上市公司的数字化与智能化发展水平。该指标构建方法参考袁淳
等(2021)、吴非等(2021)的研究思路,已被广泛应用于企业数字
化转型与全要素生产率、创新能力、ESG表现等领域的学术研究。


2.jpg


【指标构建方法】
  计算公式:
    数智化关键词词频 = 年报中所有数智化相关关键词出现频次之和
    企业数智化程度 LnDig = ln(数智化关键词词频 + 1)


  关键词范围:覆盖数字经济、人工智能、大数据、云计算、物联网、
  区块链、机器学习等数智化领域核心词汇,从"B2B"至"语义搜索"
  共数十个关键词


4.jpg


【计算结果核心指标】
  - 证券代码、证券简称、stkcd、year
  - 企业数智化程度LnDig(核心指标,值越大数智化程度越高)
  - 数智化关键词词频(原始词频汇总值)
  - 行业代码、行业名称(证监会行业分类标准)
  - 所属省份、所属省份代码、所属城市、所属城市代码
  - 公司名称、上市日期、成立日期、注册资本、经营范围等基本信息


【输出文件版本说明】
  1. 计算结果未剔除未缩尾版本
     保留全样本(含金融业、ST/PT公司),未做缩尾处理
  2. 计算结果已剔除金融STPT未缩尾版本
     剔除金融业(行业代码J类)及ST、PT公司
  3. 计算结果已剔除金融STPT已缩尾版本
     在剔除基础上对LnDig及词频按前后1%缩尾处理


3.jpg


【原始数据文件】
  1. 上市公司年报数智化关键词词频数据.dta / .xlsx
     各公司年报中每个数智化关键词的出现频次原始数据
  2. 上市公司基本信息数据.dta
     上市公司基本注册信息(公司名称、行业、上市日期等)
  3. 上市公司行业与地区信息数据.dta
     上市公司逐年行业分类及省份、城市归属信息


【代码文件】
  - 上市公司数智化程度数据计算代码.do / .py
    Stata 与 Python 双版本计算代码,可复现全部结果
  - 上市公司数智化程度数据评估代码.do / .py
    数据描述性统计与质量评估代码


5.jpg


【参考文献】
  - 企业数智化与量化预算目标信息披露行为(详见文件夹内PDF)
  - 袁淳, 肖土盛, 耿春晓, 等. 数字化转型与企业分工:专业化
    还是纵向一体化[J]. 中国工业经济, 2021(09)
  - 吴非, 胡慧芷, 林慧妍, 等. 企业数字化转型与资本市场表现
    ——来自股票流动性的经验证据[J]. 管理世界, 2021(07)


1.jpg


【数据基本信息】
  数据名称:上市公司数智化程度数据
  数据范围:A股上市公司
  时间范围:2000-2024年
  数据来源:上市公司年度报告文本挖掘 +权威数据库
  更新时间:2026年




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群