全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
591 1
2024-11-09
数据介绍:
  • 年份:2000-2023
  • 围:A股上市公司
  • 三个版本:数字金融认知(未缩尾未剔除)数字金融认知(已缩尾未剔除)、数字金融认知(已缩尾已剔除金融STPT)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)

文件.png


计算说明

【指标构造方法】

第一步,整理上市公司年报,并通过Python的Java PDFbox库提取所有文本内容,以此作为后续特征词筛选的数据基础;

第二步,参考文献制定出年报中有关“数字金融”的词典(共计11个关键词);

第三步,搜集文本数据后,使用Python中jieba分词对年报文本进行分词处理,统计数字金融相关关键词的出现次数,统计年报总字符数;

第四步,计算每万字年报描述中包含的对数字金融相关关键词的提及次数,即为数字金融认知




参考文献

  • 王诗卉,谢绚丽.经济压力还是社会压力:数字金融发展与商业银行数字化创新[J].经济学家,2021,(01):100-108.


参考.png




代码:

代码.png




数据量:

数据量.png



描述性统计:

描述性统计.png




结果数据


结果数据.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-11-9 18:41:40
感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群