经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
提问 悬赏 求职 新闻 读书 功能一区
›
经管文库(原现金交易版)
【数据】各省融资问题重视度与行动力python-do数据2002-2024年
楼主
学软件我快乐
56
0
收藏
2026-02-10
一、数据概述
数据名称:省级融资问题重视度与行动力数据
数据范围:2002-2024年
数据层级:省级面板数据(省份 × 年份)
数据来源:各省份政府工作报告文本词频分析
构建方法:TF-IDF(词频-逆文档频率)加权方法
参考文献:官员企业经历能降低公司债务融资成本吗?
二、核心指标说明
本数据集包含两个核心指标,均基于省级政府工作报告的文本分析构建:
1. 融资问题重视度(Emph_D)
- 变量名:融资问题重视度Emph_D
- 含 义:衡量省级政府在工作报告中对融资问题的关注和重视程度
- 词汇范围:从"缓解企业融资"到"融资额"的一系列融资相关词汇
- 值域特征:连续型非负数值,值越大表示重视程度越高
2. 融资问题行动力(Action_D)
- 变量名:融资问题行动力Action_D
- 含 义:衡量省级政府在工作报告中就融资问题提出的具体行动措施力度
- 词汇范围:从"引导金融机构"到"金融科技"的一系列政策行动词汇
- 值域特征:连续型非负数值,值越大表示行动力度越强
三、TF-IDF加权计算方法
单词j的TF-IDF加权值 = [(1 + ln(tf_j)) / (1 + ln(a))] × ln(N / df_j)
其中:
tf_j = 词汇j在该份政府工作报告中出现的原始频次
a = 该份政府工作报告的总字数
N = 语料库中政府工作报告的总篇数(即数据集的观测总数)
df_j = 至少包含词汇j一次的政府工作报告篇数
最终指标计算:
Emph_D = 重视度维度所有词汇TF-IDF加权值之和
Action_D = 行动力维度所有词汇TF-IDF加权值之和
四、数据变量列表
计算结果数据(计算结果省级版本.dta / .xlsx)包含以下变量:
变量名 类型 说明
─────────────────────────────────────────────────────────────────
省份 字符串 省份全称(如"北京市""广东省"等)
省份编码 数值型 省份行政区划编码(如11=北京、44=广东)
年份 数值型 数据年份(2002-2024)
融资问题重视度Emph_D 数值型 融资问题重视度指标(TF-IDF加权)
融资问题行动力Action_D 数值型 融资问题行动力指标(TF-IDF加权)
五、文件清单
本数据包包含以下文件:
(一)原始数据文件
1. 政府工作报告文本词频数据.dta —— Stata格式原始词频数据
2. 政府工作报告文本词频数据.xlsx —— Excel格式原始词频数据
3. 省份编码信息数据.dta —— 省份名称与行政区划编码映射表
(二)计算结果文件
4. 计算结果省级版本.dta —— Stata格式计算结果(主数据)
5. 计算结果省级版本.xlsx —— Excel格式计算结果
(三)计算代码
6. 省级融资问题重视度与行动力数据计算代码.do —— Stata版计算代码
7. 省级融资问题重视度与行动力数据计算代码.py —— Python版计算代码
(四)评估代码
8. 省级融资问题重视度与行动力数据评估代码.do —— Stata版数据质量评估代码
9. 省级融资问题重视度与行动力数据评估代码.py —— Python版数据质量评估代码
(五)参考文献
10. 官员企业经历能降低公司债务融资成本吗_.pdf —— 方法论参考文献
(六)评估报告
11. 数据质量评估报告_YYYYMMDD/ —— 评估输出文件夹(运行评估代码后生成)
├── 评估日志_YYYYMMDD.log
├── 数据分布分析/ (描述性统计表:全样本、分年度、分省份)
├── 分布图/ (直方图、核密度图、箱线图、散点图矩阵、时间趋势图等)
├── 异常值检验/ (IQR法、Z-score法异常值明细)
├── 逻辑合理性验证/ (时间连续性、省份编码一致性、年度变化率)
└── 稳健性测试/ (分期对比、缩尾处理、排除特殊年份等)
六、使用说明
1. 直接使用计算结果
- 打开"计算结果省级版本.xlsx"或加载"计算结果省级版本.dta"即可使用
- 可通过"省份编码"和"年份"变量与其他省级面板数据进行合并
2. 重新计算数据
- Stata用户:运行"省级融资问题重视度与行动力数据计算代码.do"
(需要Stata 15+版本)
- Python用户:运行"省级融资问题重视度与行动力数据计算代码.py"
(需要pandas、numpy库)
- 运行前请确认工作路径指向本数据包所在文件夹
3. 运行数据质量评估
- Stata用户:运行"省级融资问题重视度与行动力数据评估代码.do"
- Python用户:运行"省级融资问题重视度与行动力数据评估代码.py"
(需要pandas、numpy、matplotlib、seaborn、scipy库)
- 评估结果将自动保存到以日期命名的输出文件夹中
4. 数据合并示例
- Stata: merge 1:1 省份编码 年份 using 计算结果省级版本.dta
- Python: df.merge(result, on=["省份编码", "年份"], how="left")
省级融资问题重视度与行动力数据2002-2024年.zip
大小:(7.5 MB)
只需: RMB 32元
马上下载
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
栏目导航
经管文库(原现金交易版)
IT基础
行业分析报告
新手入门区
论坛培训
数据分析与数据科学
热门文章
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
失去的三十年:平成日本经济史(【日】野口 ...
表格结构数据的核心特征及具象实例解析
表格结构数据特征与CDA数据分析师:精准适配 ...
2026中信里昂风水指数
2026年中国白银行业市场供需现状及发展趋势 ...
人工智能时代的智能教育(英)
中国智能家电市场趋势洞察
新宏观丨豆包,传统经济学与商学对全球性债 ...
毕马威 - 中国内地与香港IPO市场2025年回顾 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群