我要建立一个多元线性回归模型,因为不是数学专业,有几个问题不了解请数学高手指点迷津
1.建立模型的时候随机抽取的训练集样本数>总体样本的50%就可以了吗?那取4/5或者2/3做训练集也是可以的?有没有更好的建议?
2.假如分别用逐步回归和主成分分析分别建立一个模型得到相关系数和标准差,你对于验证集也是用同样的方法建立方程得到验证集的相关系数和标准差吗?有时候验证集样本数小于10个且小于自变量个数不就不能用逐步回归分析了吗?
3.交叉(交互)验证交叉验证是对整个训练集做的吗?如抽一法能用软件做吗?那个Rcv怎么算出来?
4.我用的spss多国语言版,可是想装PLS模块怎么装了也用不了,谁装过PLS插件的帮个忙
以上问题希望有高人指点,感激不尽!