全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
2172 3
2012-10-03
张老师,您好。我在遇到片最小二乘回归时遇到如下问题,烦请您指点。

1、偏最小二乘回归是否需要预先对数据标准化,看了很多教材案例,有的说标准化好,有的也没提标准化的事,哪一种处理在统计学上和实际应用上最好?

2、为了得到偏最小二乘回归结果,我先后用了spss(安装pls插件和pthlon包),statistica、simca和dps对同一个数据进行计算,结果发现存在一定差异。很不解。其中spss和statistica的结果基本一致(回归系数,R2)。但是simca的结果与spss和statistica不同,查阅相关教程和网络教程,提到simca是专门用于pls回归的软件,据称算法比spss更好,为什么回归系数在两个软件中不一致,与哪些处理步骤有关(数据标准化?是否要截距),请指教。

3、statistica软件在pls模型上比spss模块丰富,还有是否要截距项的选项。在一般的教程中对此都没有提及,如果一般分析,需要针对截距项的有无进一步分析吗?

非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-10-8 09:48:17
1. 这类复杂的算法为了避免测量尺度的影响,原则上都是应当先对原始变量做标准化和正态化的,当然有的软件在算法里内嵌了标准化,可以不做,比如SPSS中的因子分析就是如此(算法直接内嵌了标准化步骤)。这个需要查阅每个软件的算法说明,所以保险起见最好都先做标化。

2. 算法不同得到不同的结果是很正常的,特别是使用ML或者其他迭代收敛算法的时候更是常见。simca我没用过,所以没法给出具体的问题所在。

3. 绝大多数问题中,截距是多少,有无显著意义都是不重要的,所以除非特殊要求,不要去限定截距(对此问题的进一步参考文献是那个著名的画蛇添足的故事)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-8 11:58:48
张文彤 发表于 2012-10-8 09:48
1. 这类复杂的算法为了避免测量尺度的影响,原则上都是应当先对原始变量做标准化和正态化的,当然有的软件在 ...
非常多谢您强调截距的不必要性。

您提到软件估算的结果都可能有不同之处,是否应该主要原因由小数点保留和四舍五入的缘故。比较让我纠结的是两种软件差异比较大,而其中一种软件恰好为众多外文文献所应用(ps即simca)。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-9 10:29:31
结果不同不是四舍五入之类的问题,迭代算法不同于最小二乘法,只是对期望值的逼近或者近似,所以不同的迭代算法完全可能得到不同的逼近值,算法的提出者也会做模拟研究来验证逼近效果如何。要弄清楚哪个更好,只有去查作者发表的原始文献中的模拟实验结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群