全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
74 0
2026-03-17
数据年份:2001-2024
数据范围:A股上市公司
数据版本:智能化转型程度(未缩尾未剔除)、智能化转型程度(已缩尾未剔除)、智能化转型程度(已缩尾已剔除金融STPT)
文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
代码格式:do文件


计算说明:
      基于上市公司年报文本进行文本分析和词频统计,将公司智能化转型关键词在年报MDA中的词频数÷同年同行业公司智能化转型关键词在年报MDA中的词频数作为衡量公司智能化转型程度的代理指标。具体而言,首先整理了上市公司年报,并通过Python的Java PDFbox库提取所有文本内容,并进一步筛选出MDA部分,以此作为后续特征词筛选的数据基础。搜集文本后,使用Python中的jieba分词将MDA部分进行分词处理,提取智能化转型关键词在年报MDA中的词频数,计算公司智能化转型关键词在年报MDA中的词频数÷同年同行业公司智能化转型关键词在年报MDA中的词频数,即为公司智能化转型程度
        智能化转型关键词如下:智能制造、数字化、智能化、信息化、自动化、云计算、云平台、物联网、数据可视化、信息物理系统、网络物理系统、大数据、感知技术、云制造、主劫制造、智慧制造、智能企业、智能终端、智能识别、机器人、工业4.0、工业互联网、互联网+、人机交互、传感器、控制器、数据挖掘
智能化转型程度=智能化转型词频/同年同行业智能化转型总词频
处理软件:原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式


参考文献
李婉红,王帆.智能化转型、成本粘性与企业绩效——基于传统制造企业的实证检验[J].科学学研究,2022,40(01):91-102.



   

代码:




数据量


描述性统计:


结果数据



附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群