全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
1806 3
2024-10-12
数据介绍:
  • 年份:2001-2023
  • 围:A股上市公司
  • 三个版本:管理层短视主义(未剔除未缩尾)、管理层短视主义(已剔除金融STPT未缩尾)、管理层短视主义(已剔除金融STPT已缩尾)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)

文件.png





参考说明
  • 胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?一一基于文本分析和机器学习.管理世界,2021,37(05):139-156+11+19-21


参考.png





计算说明

基于上市公司年报文本进行文本分析和词频统计,将管理短视主义关键词在年报 MDA 中的词频占比*100 作为衡量管理者短视主义的代理指标。具体而言,首先整理了上市公司年报,并通过 Python 的 Java PDFbox 库提取所有文本内容并进一步筛选出 MDA 部分,以此作为后续特征词筛选的数据基础。搜集文本后,使用 Python 中的jieba 分词将 MDA部分进行分词处理,生成 MDA 整体词频,最后提取管理者短视主义关键词在年报 MDA 中的词频计算管理者短视主义关键词在年报 MDA 中的词频占比*100 即为结果


参考中列示的关键词如下:严峻考验、之时、之际、关头、前夕、即刻、压力、双重压力、困境、在即、天内、契机、尽快、年内、恰逢、数天、数月、日内、最晚、最迟、来临之际、正
逢、立刻、考验适逢、通胀压力、遇上、随即、难度、马上


处理软件:原始数据为使用 Python对上市公司年报进行文本分析后获得(iieba分词,停用词表使用哈工大停用词表),后续使用Stata 进行整理,最终形成面板数据形式




代码:

代码.png

数据量:

数据量.png

描述性统计:

描述性统计.png

结果数据

结果数据.png




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-10-18 17:16:37
感谢分享,数据很好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-10-18 21:58:56
可以问点详细问题吗,已私信
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-11-12 15:30:49
感谢分享好数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群