全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
346 4
2025-01-07
数据介绍:
  • 年份:2000-2023
  • 围:A股上市公司
  • 三个版本:大数据应用指数(未缩尾未剔除)、大数据应用指数(已缩尾未剔除)、大数据应用指数(已缩尾已剔除金融STPT)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)

文件.png



计算说明:

       参考中将最核心的大数据应用的衡量指标(InBigdata)具体定义为:公司年报中提及大数据相关关键词的次数加一后取对数。由于大数据应用情况随年份增长趋势明显,将InBigdata按照“公司—年份”的观测值确定每年缩尾(winsorize)上下极值各1%。

大数据相关关键词如下:大数据、海量数据、数据中心、信息资产、数据化、算力
大数据应用指数=In(大数据相关关键词词频+1)

处理软件原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式



参考文献

  • 张叶青,陆瑶,李乐芸.大数据应用对中国企业市场价值的影响——来自中国上市公司年报文本分析的证据[J].经济研究,2021,56(12):42-59.


参考1.png     
参考2.png



代码:


代码.png


数据量
数据量.png

描述性统计:

描述性统计.png



结果数据

结果数据.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2025-1-20 18:05:04
提示: 作者被禁止或删除 内容自动屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群