时间跨度
2007-2022年
数据范围
基础数据和代码
注:参考本篇论文的做法,在收集上市公司的样本数据时,进行了如下处理:
(1)剔除了金融行业公司
(2)剔除了信息传输、软件和信息技术服务业以及科学研究和技术服务行业
(3)剔除当年处于 ST 和*ST 状 态的样本
指标说明
本文选取的变量如以下数据指标体系所示:
注:在本数据集中,非常规高技能劳动力表示为上市公司的研发人员占公司总体员工的比重(%),常规低技能劳动力则表示为100%-非常规高技能劳动力。本数据集将收集到的四个季度的托宾Q的值取算数平均后,做为了企业价值的替代变量。
本数据在收集过程中,研发人员占企业总员工人数数据并不完整,所以非常规高技能劳动力与常规低技能劳动力数据在部分企业和年份存在缺失。
此外,本数据集在进行上市公司年报以及MD&A中人工智能词频分析时,选取的人工智能词典也列示如下。
变量名称 | 变量符号 | 变量描述 |
全要素生产率 | TFP | 根据奥利和帕克斯(1996)的方法计算 |
年报人工智能关键词词频 | Lnwords | 上市公司年报中人工智能关键词数量加1,取自然对数 |
年报中MD&A部分人工智
能关键词词频 | Lnwords_MD&A | 上市公司年报中MD&A部分人工智能关键词数量加1,取自然对数 |
人工智能专利数量 | Lnpatent | 上市公司当年申请的人工智能专利数量加1,取自然对数 |
常规低技能劳动力 | Routine | 上市公司生产、业务、市场和财务人员数量,除以企业员工人数 |
非常规高技能劳动力 | Non_routine | 上市公司技术和研发人员数量,除以企业员工人数 |
企业价值 | Tobinq | 企业市场价值/(资产总计-无形资产净额-商誉净额) |
公司规模 | Size | 公司员工总数,取自然对数 |
公司年龄 | Age | 公司成立年龄,取自然对数 |
资产负债率 | Leverage | 总负债/总资产 |
成长性 | Growth | 销售收入增长率,取自然对数 |
董事会规模 | BoardSize | 董事会人数,取自然对数 |
两职合一 | Dual | 董事长与总经理两职合一时取1,否则取0 |
股权集中度 | Top1 | 第一大股东持股比例 |
技术创新 | Lnallpats | 企业申请专利总数加1,取自然对数 |
人工智能词典
年份 | 股票代码 | 公司名称 | 总词频 |
词频加1取对数 | 人工智能 | 计算机视觉 | 图像识别 |
知识图谱 | 智能教育 | 增强现实 | 智能政务 |
特征提取 | 商业智能 | 智能养老 | 支持向量机(SVM) |
知识表示 | 模式识别 | 物联网 | 人机对话 |
AI产品 | 人机交互 | 数据挖掘 | 智慧银行 |
智能客服 | 虚拟现实 | 自动驾驶 | 无人驾驶 |
智慧金融 | 大数据营销 | 长短期记忆(LSTM) | 智能芯片 |
边缘计算 | 云计算 | 深度神经网络 | AI芯片 |
深度学习 | 特征识别 | 智能保险 | 智能零售 |
智能医疗 | 智能运输 | 智能家居 | 循环神经网络 |
大数据风控 | 机器人流程自动化 | 可穿戴产品 | 大数据平台 |
增强智能 | 大数据运营 | 机器翻译 | 神经网络 |
语音合成 | 人机协同 | 智能农业 | 智能音箱 |
卷积神经网络 | 问答系统 | 强化学习 | 大数据分析 |
自然语言处理 | 大数据管理 | 智能计算 | 语音交互 |
机器学习 | 生物识别 | 语音识别 | 智能监管 |
智能投顾 | 智能语音 | 声纹识别 | 人脸识别 |
智能体 | 大数据处理 | 分布式计算 | 智能传感器 |
智能搜索 | 智能环保 | | |
参考文献
姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率?——基于劳动力技能结构调整的视角[J].管理世界,2024,40(02):101-116+133+117-122.