全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
2898 5
2011-06-28
已知Grain yield per plant(y)   1000-grain weight (x1) Grains per panicle (x2) Number of tillers(x3)有关系
且有241个数据,我根据这些数据做多元回归分析,
首先做回归拟合得拟合方程y=a0+a1x1+a2x2+a3x3,然后对误差项做正态W检验得W = 0.5535, p-value < 0.0001,根据p值发现残差是不服从正态分布的。然后做
逐步回归,得到得最优模型还是还有x1,x2,x3三个参数的回归模型。
然后我就考虑可能是数据中有部分异常值的存在,因此我根据异常值的简便识别方法Q1-1.5R1,Q3+1.5R3,来筛选掉异常值,从新做回归分析,在对回归误差项做正态W检验得W = 0.9843, p-value = 0.01378(<0.05 &&>0.01 ),这样看来在在置信度0.05时还是不服从正态分布。


这样之后我应该怎么做进一步的分析呢?还是说线性回归已经做不下去了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-6-28 12:26:26
为什么要做这么多分析呢???
看不懂……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-28 12:48:57
首先,x1,x2,x3是解释变量并不是参数
其次,回归分析并不是一味的追求残差满足正态分布,
改进的方法:根据你只有3个变量,可以先做一下响应变量和每个解释变量的关系图,如果有直线趋势,说明你的模型建立线性的是合理的,如果不是,就选则非线性,比如二次等其他函数关系;另外你的三个解释变量之间是否具有多重共线性,这个需要事先检验,不过通过你的逐步回归的结果可以说明三个变量之间不存在多重共线性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-28 14:39:04
3# 楚韵荆风
谢谢,
我做过可以先做一下响应变量和每个解释变量的关系图,线性关系很不明显,也就是说我做的线性回归是不合理的吗?还有难道说响应变量和每个解释变量有线性趋势,才能做线性回归吗?还有就选则非线性,比如二次等其他函数关系(我应该从哪个函数关系着手分析先额)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-28 21:31:27
4# zljiutian

对于非线性,可以通过经验尝试。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-11 13:04:49
用多项式回归试试,可能不是单纯的线性关系
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群