全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
359 0
2022-11-17
  • 明确需求(因变量Y)

  • 采集数据,数据清洗(缺失值,异常值(3倍标准差),分类变量)

  • 变量筛选(相关系数,散点图)

  • 分割测试集(80%),训练集(20%)

  • 用训练集来做回归模型(F检验,t检验,R^2 ,调整R^2),R^2不能太高,不能太低

  • 模型检验,高斯马尔科夫假设(

    a. 线性于参数


b. 随机抽样

c. 不存在完全共线性

d. 误差的条件均值为零误差

e的同方差性

f. 误差的正态性

7.模型优化(交互项,高次项,平方项,季节趋势)

8.逐步回归,交叉检验

9.模型测试




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群