全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
5628 21
2015-07-15
新手又来向各位前辈指教了,望能够得到大家的批评和建议~~

本人研究的主要目的是建立城市用地转换的预测模型,共有四类因变量和13类自变量,其中自变量都是连续的测量数值,但是为了计算简便,本人自己将所有数据依据经验划分为了递增的等级数据,分别用1-10之间的数字来代表他们参与模型计算~~这是前提

然后,在逻辑回归分析的准备阶段,考虑到自变量都是有序递增的,我将所有的自变量都设置为协变量类型,最终分析结果如下

1.JPG

2.JPG
3-1.JPG
3-2.JPG
4.JPG


我的问题是:
1. 我的自变量处理方法是否恰当??选择协变量类型是否合适?
2. 结果中的哪些数据能判断我的模型构建是否与真实数据相符?模型预测准确度是否良好?
3.如果模型是正确的,那么B是否就代表了自变量在公式中的系数?而且没有通过显著性检验的参数是否没有必要再纳入公式计算了呢?
4. 如果处于显著性检验标准附近的参数(0.05),该如何取舍?

谢谢各位指导~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-15 09:10:59
第一个问题:不明白自变量明明是连续性的变量,楼主为什么要把它处理为类别变量,这背后有什么文献/理论上的依据么?即使楼主有依据这样做了,那在后面的建模分析中应该将类别变量处理为哑变量(虚拟变量)的形式纳入模型,而不是以类别变量直接纳入模型,这样会出问题的。所以建议楼主还是用连续性的变量直接纳入模型吧。PS:在建模前对数据做一些预处理,如右偏态分布数据取对数等。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-15 09:13:05
第二个问题:其实楼主想问的是模型的拟合效果(即像多元回归里面一样有个R^2)。然而logit模型不像多元线性回归,会有一个R^2,logit模型会报告一个准R^2(Pseudo R^2),但这个只能做一个参考,没有多大实际意义;判断拟合优度的另外一个方法是看正确预测的百分比,因为Logit是个概率模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-15 09:18:01
第三个问题:B是代表自变量对应的偏回归系数。至于你说的“没有通过显著性检验的参数是否没有必要再纳入公式计算了呢?”这个问题有意思。我想楼主没有明白一个问题,就是你的自变量选取可能是你自己根据常识/一些文献来的,没有找到变量背后选择的理论基础/研究框架。如果是这样,根据我们的常识,要做一个因变量的影响因素分析,我可以根据常识选择10个,20个,甚至更多的变量,其实这没多大意思。你看真正严格做的好的文章都是基于一定的理论基础/研究框架选取的指标,有时可能就那么几个指标。而且人家还做了研究假设的。所以回到你这个问题。指标选取要基于一定理论基础/研究框架,然后做出相应的研究假设,最后构建模型证实或证伪。这时,不显著的变量要考虑从专业层面去思考为什么不显著,而不像你这样根据常识选一些指标,不显著我就不要了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-15 09:21:53
第4个问题:你可以选取3个显著性水准(即0.1,0.05和0.01)作为你的显著性水准关卡。这样可能就更好取舍一些。其实通常在0.1这个最高标准附近的变量的显著性都不是那么太关注了(如0.099和0.101我认为没太大差别),因为这个时候相比于其它显著性更强的变量,此类变量对应的偏回归系数一般都比较小了(显著性通过t值和临界值比较,t=偏回归系数/标准误)。换算回去对因变量的作用不大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-15 09:40:27
进来学习!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群