注:2025年5月更新,本次数据为MD&A报告统计,统计数据更新至2024年
在前文,团队利用上市公司年报全文,对人工智能的相关词频进行了统计。在本期附赠数据中,进一步对MD&A文本进行人工智能词频统计
参考《管理世界》中姚加权(2024)的做法,团队根据上市年报MD&A文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式
MD&A文本筛选:2014年及以前主要在“董事会报告”中筛选,2015年主要在“管理层讨论与分析”中筛选,2016年及往后主要从“经营情况讨论与分析”中筛选,2021-2024年主要在“管理层讨论与分析”中提取
相关数据:人工智能词频数据,MD&A数字化词频数据,人工智能招聘大数据,上市公司年报原文数据
一、数据介绍
数据名称:上市公司人工智能-MD&A报告73个词频、文本统计
数据范围:A股上市公司
数据年份:2001-2024年
样本数量:65483条,83个变量
数据来源:上市公司“管理层讨论与分析”文本
数据说明:内含人工智能73个词频、精确和扩展词汇两种方式
更新时间:2025年5月
二、整理说明
➤爬取2001-2024年上市公司年报,提取MD&A文本内容
➤将MD&A报告文本整理为面板数据
➤统计MD&A报告文本的文本长度
➤统计MD&A文本中,中英文部分的文本长度
➤构建人工智能术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇、扩展词汇数目
➤计算两种方式下的人工智能水平
三、指标说明
| 股票代码 | 股票简称 | 年份 | 
| 行业名称 | 行业代码 | 人工智能水平_精确词汇 | 
| 人工智能水平_扩展词汇 | 人工智能词频和_精确词汇 | 人工智能词频和_扩展词汇 | 
| 人工智能 | 计算机视觉 | 图像识别 | 
| 知识图谱 | 智能教育 | 增强现实 | 
| 智能政务 | 特征提取 | 商业智能 | 
| 智能养老 | 支持向量机(SVM) | 知识表示 | 
| 模式识别 | 物联网 | 人机对话 | 
| AI产品 | 人机交互 | 数据挖掘 | 
| 智慧银行 | 智能客服 | 虚拟现实 | 
| 自动驾驶 | 无人驾驶 | 智慧金融 | 
| 大数据营销 | 长短期记忆(LSTM) | 智能芯片 | 
| 边缘计算 | 云计算 | 深度神经网络 | 
| AI芯片 | 深度学习 | 特征识别 | 
| 智能保险 | 智能零售 | 智能医疗 | 
| 智能运输 | 智能家居 | 循环神经网络 | 
| 大数据风控 | 机器人流程自动化 | 可穿戴产品 | 
| 大数据平台 | 增强智能 | 大数据运营 | 
| 机器翻译 | 神经网络 | 语音合成 | 
| 人机协同 | 智能农业 | 智能音箱 | 
| 卷积神经网络 | 问答系统 | 强化学习 | 
| 大数据分析 | 自然语言处理 | 大数据管理 | 
| 智能计算 | 语音交互 | 机器学习 | 
| 生物识别 | 语音识别 | 智能监管 | 
| 智能投顾 | 智能语音 | 声纹识别 | 
| 人脸识别 | 智能体 | 大数据处理 | 
| 分布式计算 | 智能传感器 | 智能搜索 | 
| 智能环保 |  |  |