全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 真实世界经济学(含财经时事)
3993 22
2010-11-17
背景:

中国社会科学院世界经济与政治研究所徐奇渊发表的研究报告《统计数据和主观感受:CPI是风动还是帆动?》利用CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8 ,对得到的常数项估计值-7.53,该文中做了如下解释:“有一部分变化值(-7.53)是无法用8个分项指数及其权重解释的……因此,-7.53 可以被视为人为调整的痕迹”。

然后thunders 在论坛中用一篇 cpi真的被低估了7%吗? 进行了反驳。我个人思考了一下,然后用数据进行了计算。和大家共同讨论。

思考:

1.由于统计调查制度是制度性的东西,是死的。cpi计算就是一个固定的东西,输入现期各种商品价格,与历史数据比较,算出各种商品cpi,然后加权算出总cpi。虽然复杂的多,但大体是这样。如果统计数据按照徐奇渊的说法,认为调低,也应该从基础数据上改,哪能连分类cpi都不改,直接改总cpi的道理。真是这样的话,这假造的也太没水平了,拿全国人民当傻子啊,统计系统也太没技术含量了吧。

2.公式CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8本身就是错误的。

从纯数学角度讲应该是个固定函数关系,a=0,Ebi=1。谁家用GDP一二三产去回归GDP呀,当然,举得这个例子不恰当,但是数学逻辑是一样,不过一二三产的加权系数固定为1罢了。解8个权重,只要有8个方程组成的8元1次方程组cpi=CPI*B(cpi为总cpi历史数据向量,CPI为分类cpi历史数据矩阵,B为权数向量)就可以搞定了。(前提是方程系数矩阵的秩=8,即不存在多重共线性)

从技术角度看,如果限定了a=0,Ebi=1,这样回归也没有错,因为加权系数未知,而因为发布的cpi数据小数位数较少,四舍五入的原因,加权结果必然存在误差。再加上权重是变化的,一年一小调整,几年一大调整。所以估计出准确值有困难。用ols是一个可行的办法。

虽然一年内权重没变化,一年12个月数据确实完全可以满足解方程组需要,但是由于商品价格变化同步性很强,各分类指数间存在很强的相关性,方程组共线性很强,共线性太过明显就会导致有效数据量不足,求出的解是一个解空间,而不是一个唯一解。ols回归后只能求出残差平方和最小的那一个。ols算出来的数据很多情况下有负数存在,就说明了这一点。

3.“近5年CPI或低估逾7%”报道很热门,但是我没想到是用CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8这样的公式算出来的。如果是真的,中国社会科学院世界经济与政治研究所国际金融研究中心的牌子是让徐给砸了。水平也太差了点,技术上本科生的水平绰绰有余,理论上逻辑上连多重共线性原理也没有搞清楚。多重共线性下最小二乘回归的结果很难是正确的。就好比是3x+y=4,他只求出x=y=1,结论很明显太偏颇了。

计算:

经过我的计算,2009年、2010年分别用ols计算出来的八大类商品价格指数权重确实存在负数,但是这并不能说明数据造假。只能说明数据存在明显的共线性。

我用2009.1-2010.9这21个月份的全国cpi数据进行计算,由于这21个月序列权重应该只存在一次小调整,对结果的影响应该不是很大

计算方式:cpi=CPI*B,推导出B=CPI\cpi,直接用matlab输入数据,直接输入上面公式就ok了,计算结果同统计软件ols结果相同,但数学关系更明确。大家也可以试试各种软件,那样傻瓜式的操作还可以得到更多的检验统计量。我的计算结果如下:

0.349277385648786
0.0303957192994561
0.0999135676656420
0.0559304422417549
0.0755870037999842
0.118268753644819
0.131066042061086
0.139285350627462

sum=0.999724264988990约等于1。我个人感觉这个数据可以接受,而我并没有使用权重和等于1这个前提,sum=0.9997算是结果后验了权重和=1的存在,反过来证明了结果的正确性。
并且与http://zhidao.baidu.com/question/48244870.html上面提供的大概权重:食品34%,日用品5%,衣着9%,家庭设备及维修4%,医疗保健11%,交通通信9%,娱乐教育文化15%,居住14%虽有一定差距,但也很接近,说明数据存在一定的可信度。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-11-17 13:41:01

补充所用数据,来自国家统计局官方网站
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 13:44:18
样本太少啊。。可信度不大。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 14:03:10
对于确定的八元一次函数关系,又不是仅仅存在数据上的的回归关系,有效样本数只要达到八个,组成八元一次方程组,就可以解方程了。再考虑到sum=1,七个有效样本就ok!

比如二元一次方程,只需两个且有效,比如
     3x+y=4
          x+y=2
(2x+2y=4, x+y=2就不算是两个有效样本)
就可以直接解出x=1,y=1来了,还用的着多大样本???
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 15:37:57
数据的真实性,我持怀疑态度
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-17 16:29:32
楼主,你看看八个变量有没有多重共线性?

下结论要慎重一些(这八个是同比指标,类似于差分的口径,没有明显的趋势性)

再者你看看原文:回归结果各项系数t检验值全部都异常显著,何来多重共线性的症状?因此你这个批评是站不住的。

下面是八个指标的相关系数矩阵:
附件列表
0000无标题.png

原图尺寸 202.61 KB

0000无标题.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群