注意:此数据是老师带领我们课题组一起弄的,数据内容均来源于官方,和官方内容保持一致!此外,我们课题组一直关注此类数据,并应用此类数据进行过多次研究,截至2025,该数据官方更新至2023年。目前网上有一些非常不负责任的人,号称有2024年数据的,官方都没更新,也不知道他的数是哪来的,估计连同他别的年份数据也都是不真实的,数据对于科研是非常重要的,大家一定注意甄别!我们的数据是课题组自用数据,已有成果产出,是经过验证的真实数据,大家可以放心使用!
参考《管理世界》中姚加权(2024)的做法,团队根据上市年报文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-
人工智能水平,包括精确词汇、扩展词汇两种方式
利用上市公司年报文本全文数据,对“人工智能”73个相关词频进行了统计,衡量上市公司人工智能水平,此次更新数据至2023年。
一、数据介绍
数据名称:企业人工智能-年报73个词频、文本统计
数据范围:A股上市公司
数据年份:1999-2023年
样本数量:63052条,84个变量
年报来源:巨潮资讯网
数据说明:内含人工智能73个词频、精确和扩展词汇两种方式
二、整理说明
➤下载1999-2023年上市公司年报
➤将原始报告文本整理为面板数据
➤统计年报全文的文本长度
➤统计全文中,中英文部分的文本长度
➤构建人工智能术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇、扩展词汇数目
➤计算两种方式下的人工智能水平
三、指标说明
股票代码 股票简称 年份
行业名称 行业代码 人工智能水平_精确词汇
人工智能水平_扩展词汇 人工智能词频和_精确词汇 人工智能词频和_扩展词汇
人工智能 计算机视觉 图像识别
知识图谱 智能教育 增强现实
智能政务 特征提取 商业智能
智能养老 支持向量机(SVM) 知识表示
模式识别 物联网 人机对话
AI产品 人机交互
数据挖掘
智慧银行 智能客服 虚拟现实
自动驾驶 无人驾驶 智慧金融
大数据营销 长短期记忆(LSTM) 智能芯片
边缘计算 云计算 深度
神经网络
AI芯片
深度学习 特征识别
智能保险 智能零售 智能医疗
智能运输 智能家居 循环神经网络
大数据风控 机器人流程自动化 可穿戴产品
大数据平台 增强智能 大数据运营
机器翻译 神经网络 语音合成
人机协同 智能农业 智能音箱
卷积神经网络 问答系统 强化学习
大
数据分析 自然语言处理 大数据管理
智能计算 语音交互
机器学习
生物识别 语音识别 智能监管
智能投顾 智能语音 声纹识别
人脸识别 智能体 大数据处理
分布式计算 智能传感器 智能搜索
智能环保
四、人工智能词典选取:
人工智能;AI产品;AI芯片;机器翻译;机器学习;计算机视觉;人机交互;深度学习;神经网络;生物识别;图像识别;数据挖掘;特征识别;语音合成;语音识别;知识图谱;智慧银行;智能保险;人机协同;智能监管;智能教育;智能客服;智能零售;智能农业;智能投顾;增强现实;虚拟现实;智能医疗;智能音箱;智能语音;智能政务;自动驾驶;智能运输;卷积神经网络;声纹识别;特征提取;无人驾驶;智能家居;问答系统;人脸识别;商业智能;智慧金融;循环神经网络;强化学习;智能体;智能养老;大数据营销;大数据风控;大数据分析;大数据处理;支持向量机(SVM);长短期记忆 (LSTM);机器人流程自动化;自然语言处理;分布式计算;知识表示
智能芯片;可穿戴产品;大数据管理;智能传感器;模式识别;边缘计算;大数据平台;智能搜索;云计算;増强智能;智能计算;物联网;语音交互;智能环保;人机对话;深度神经网络;大数据运营
我们课题成员始终坚持求真务实的学术态度,不善用夸大的语言进行营销。参与本论坛的初衷在于搭建开放的学术交流平台,与各位同仁分享阶段性研究成果,共同进步。对于数据相关疑问,欢迎大家通过私信展开深度探讨。在此特别强调:我们坚决维护知识产权,所有资料严禁以任何形式进行转售。愿与大家共建良性学术生态,谨祝各位在探索真理的道路上收获丰硕成果!