您描述的这个项目是一个典型的大数据应用案例,使用百度搜索指数作为替代指标来构建中国数字普惠金融或金融科技的发展指数。这种做法在学术界和业界都越来越常见,尤其是在研究社会经济现象时缺乏直接量化数据的情况下。
### 构建过程
1. **关键词选择**:首先,从已有的研究文献中选取与金融科技相关的关键词库。这可能包括“互联网支付”、“区块链”、“大数据”、“移动金融”等。
2. **数据收集**:利用百度指数API或手动搜索,获取每个关键词在每年每个月的搜索频率。由于百度的数据可追溯至2011年,故选择了2011-2022年的数据作为样本期。
3. **数据处理**:
- 将各年度、各月份的关键词搜索量进行求和并取对数变换,以减少极端值的影响。
- 运用熵值法等统计方法来整合多个关键词的数据,形成一个单一的指数。这通常需要考虑关键词之间的相关性和信息贡献度。
4. **人口因素调整**:考虑到不同地区或时间的人口规模可能影响搜索行为,对数据进行了相应的标准化处理。
5. **数据分析与应用**:
- 将整理后的面板数据用于基准回归分析。
- 进行稳健性检验,确保结果的可靠性。
### 参考文献
您提到参考了《金融研究》2020年第6期的一篇文章,“盛天翔,范从来.金融科技、最优银行业市场结构与小微企业信贷供给[J].” 这意味着您的研究可能是在分析金融科技如何影响银行市场结构以及其对小微企业贷款的可得性上。
### 总结
通过使用百度搜索指数构建金融科技指数,不仅为数字普惠金融的研究提供了一种创新的数据源和方法论,也为理解互联网技术对经济活动的影响开辟了新路径。这种方法对于那些研究缺乏直接数据支持的社会现象尤其有价值。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用