我是一名在校学生,现在在写一篇房地产价格的论文,其中需要用到面板数据。学校没有开这门课,但是在参阅了其他文献之后认为面板数据更适合我的这篇论文。
先把在论文中的变量名称简单的解释下,hp代表房价,是被解释变量;cv是解释变量,其值有正有负,是因为在上一步因子分析时数据标准化的结果。我选取了从2004年2008年35个大中城市的数据。原来想是做向量误差修正模型和格兰杰因果分析,期望能看出hp和cv之间是否存在长期均衡和短期波动以及两者之间的关系,但是刚开始学,之前也没基础,周边没有人会,所以就放弃啦。选择了面板数据回归模型。还有一个原因就是现在学校催着让发论文,所以短时间内只能先放弃向量误差修正模型和格兰杰因果分析的学习啦。
在混合模型、固定效应模型和随机效应模型比较之后,由检验结果选择了固定效应模型,但是有些问题一直搞不懂,想请教各位。本人是一小白,还望大家不要见笑,多多给予指点和建议。
第一,建立的模型是㏒hp=c+βcv,因为①两者单位不同,②在eviews中我不会做面板数据的散点图,但在SPSS中转化为二维后,做出的散点图显示hp和cv不为线性,不知这样建立的模型是否正确。或者我能否将hp的数值给标准化,建立hp=c+βcv的一个模型;
第二,我对单位根检验,其中cv只有ADF检验概率为0.0966,LLC、IPS和PP均小于0.05,hp中各检验的概率均为0.999以上或为1。而分别对二者的一阶差分进行单位根检验均显示LLC、ADF和PP检验的概率均为0.0000。那么cv和hp是否为平稳数据?另外,我的面板数据为175个,为什么在进行单位根检验时为140个?
第三,在对㏒hp=c+βcv进行回归时,得到的结果系数和cv的 t 检验均为0.0000,但是DW的数值显示1.655757,那是否可认为不存在序列相关问题?此外,由于单位根检验时,cv和hp的ADF检验的概率均大于0.05,所以在回归时,加入了AR(1),但是结果确实DW值2.567141,并且cv的 t 检验均为0.139。不知道是我在模型选择上出现了问题,还是其他原因。
论文在写到这一点实在是不知道该怎么往下进行了,希望各位能给我指点一下,非常感谢。