一、报纸文本分析
报纸文本分析是指基于某份报纸统计关键词出现频率及出现时间,并以此为依据构造宏观经济变量,如Baker基于《南华早报》构建经济政策不确定性指数。
二、报纸文本分析的应用
基于报纸的文本分析常用于构建指数,如Baker(2016)基于《南华早报》中的“中国、经济和不确定性”词频,构建了中国经济政策不确定性指数。朱军(2017)基于中国编辑、出版发行的《经济日报》、《人民日报》和《光明日报》对中国的财政政策不确定性问题构建指数,并分析了指数的波动特征和趋势变化特征。林建浩等()
二、关键词爬取
平台:Python
方法:JavaScript网页分析+ bs4
数据内容:日期,网页链接,标题,内容
爬取结果如图所示:
三、中国财政政策不确定性指数构建
(一)数据处理
指数编制参考Bloom, Baker and Davis(2016)的方法,参照朱军(2017)的关键词,对于每一份报纸,记录包含以下内容条件的文章频次:“财政支出”、“转移支付”、“地方债务”、“财政体制”、“养老金”、“财税改革”、“政策试点”、“增值税”、“消费税”、“企业所得税”、“个人所得税”、“房产税”、“税收政策”。具体而言,以任意一个关键词的文章数量为基准,度量了同时包含上述词频中任意一个关键词的文章的数量,再用样本期间的数据的标准差对时间序列进行标准化。每份报纸的简单平均数为最终指数。最后把这个平均值进行标准化,使其在样本区间的均值为100,公式如下:
(二)基本结果
1. 周度数据结果
注:左为综合指数,右为各分项指数
2. 月度数据结果
注:左为综合指数(也即财政政策不确定性指数),右为各分项指数
四、参考文献
朱军.中国财政政策不确定性的指数构建、特征与诱因[J].财贸经济,2017,38(10):22-36.
Baker,S.R,Bloom,N,& Davis,S.J.,Measuring Economic Policy Uncertainty [J].Quarterly Journal of Economics,Vol.131,No.4,2016,pp.1593-1636.