数据简介:在全球数字经济浪潮与国家创新驱动发展战略的双重推动下,数字化转型已成为中国企业提升核心竞争力、实现高质量发展的关键路径,并成为可持续性创新的主要促进因素之一,进而增强新质生产力。党的二十大报告明确提出“加快发展数字经济,促进数字经济和实体经济深度融合”,《中小企业数字化转型指南》等政策文件进一步强调数字化转型对企业创新能力的赋能作用。
本数据参考杨仁发和杨梅君(2025)的做法,利用Python爬取出2012年-2023年全部A股上市公司企业年报,并转换为txt文本格式。接着剔除金融行业企业样本,剔除样本期内暂停上市和终止上市的企业样本,也剔除被标记ST、*ST、PT 的企业样本,然后剔除所有者权益账面为负的企业样本,最后剔除资产负债率不在0—1 范围内的企业样本。
在剔除筛选完后,我们采用杨仁发和杨梅君(2025)所构建的企业数字化转型词典,共计127 个关键词,进行词频统计。在此过程中,使用Jieba中文分词词库,遍历并删除年报中的停用词,并对所提取出的年报文本进行分词处理;基于该分词结果,统计出了每家公司在不同年份的企业数字化转型关键词词频,而后汇编成企业数字化转型词频数据库。
最后,基于机器学习中词频—逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)方法测算企业数字化转型指数。
数据来源:上市公司年报
时间跨度:2012-2023年
数据格式:Excel形式
包含指标:
| 证券代码 | 证券简称 | 年份 | 企业数字化转型指数 | 人工智能 | 图像理解 | 智能数据分析 | 智能机器人 | 机器学习 | 深度学习 | 语义搜索 | 生物识别技术 | 人脸识别 | 语音识别 | 身份验证 | 自动驾驶 | 自然语言处理 | 数字技术 | 数字智能 | 数字终端 | 数字控制 | 信息技术 | 信息共享 | 信息管理 | 信息集成 | 信息终端 | 大数据 | 数据管理 | 数据挖掘 | 数据网络 | 数据平台 | 数据中心 | 数据科学 | 文本挖掘 | 数据可视化 | 异构数据 | 征信 | 增强现实 | 混合现实 | 虚拟现实 | 云计算 | 流计算 | 图计算 | 内存计算 | 多方安全计算 | 类脑计算 | 绿色计算 | 认知计算 | 区块链 | 分布式计算 | 融合架构 | 亿级并发 | EB级存储 | 信息物理系统 | 数字通信 | 物联网 | 云平台 | 平台服务 | 互联网平台 | 数字平台 | Internet | 互联网+ | 线上线下 | 线上到线下 | 线上和线下 | O2O | B2B | C2C | B2C | C2B | 虚拟社区 | 智能控制 | 智能终端 | 智能管理 | 智能工厂 | 智能物流 | 智能制造 | 智能仓储 | 智能技术 | 智能设备 | 智能生产 | 智慧农业 | 智能交通 | 智能医疗 | 智能穿戴 | 智能客服 | 智能家居 | 智能文旅 | 智能环保 | 智能电网 | 智能营销 | 商业智能 | 移动智能 | 自动控制 | 自动监测 | 自动监控 | 自动检测 | 自动生产 | 数控 | 集成控制 | 集成解决方案 | 智能故障诊断 | 生命周期管理 | 生产制造执行系统 | 高端智能 | 工业智能 | 集成系统 | 未来工厂 | 互联网商业模式 | 互联网模式 | 互联网生态 | 互联网业务 | 互联网战略 | 数字营销 | 无人零售 | 数据资产运营 | 共享服务 | 新零售 | 电商 | 电子商务 | 互联网营销 | 互联网金融 | 数字金融 | 金融科技 | Fintech | 量化金融 | 开放银行 | 数字货币 | 移动支付 | 第三方支付 | NFC支付 | 人工智能_count |
样例数据:
参考文献:杨仁发,杨梅君.数字化转型的持续性创新效应研究[J].数量经济技术经济研究,2025,(2):109-129
下载链接: