全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1065 2
2016-12-14
悬赏 200 个论坛币 已解决
请先看下这张表:
日期地区类别1类别2需预测的量

1

北京

1000

50

10+5

1

上海

2000

100

30

1

广州

3000

150

45

2

北京

2000

100

30

2

上海

3000

150

45

2

广州

4000

200

60

3

北京

3000

150

?

3

上海

4000

200

?

3

广州

5000

250

?

假设我有这样一张表,想要通过几个连续型变量:类别1+类别2的值预测另一个连续型变量
是通过前面的一段时间(训练集)预测后面的一段时间

需要预测的量,我知道大概是这么一个形式:类别1 × 类别1的缩小率 + 类别2 × 类别2的缩小率
大致这样估计的,不过我只有一个加完的值(15、30、45、30、45、60),无法得到细的分类

我现在的做法是:
proc reg data = data;
  by orgid;
  model 需预测的量 = 类别1 类别2 week1 - week7/*哑变量*/       / selection = stepwise ;
run;quit;


取得估计到的参数,拼成线性式,
但是出来的值,不太理想;而且还估出来负值

不知各位老师,有没有更合适的方法?在线等,谢谢

最佳答案

YLF870214 查看完整内容

你这样是无法用线性模型解决的,线性模型出来参数太死,而且很容易出现过拟合;如果是做预测的话,建议直接单独按照最小颗粒度估算过度因子,最后在按照正向累加的方法将结果加和,这样至少不会出现你说的负数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-12-14 16:31:28
你这样是无法用线性模型解决的,线性模型出来参数太死,而且很容易出现过拟合;如果是做预测的话,建议直接单独按照最小颗粒度估算过度因子,最后在按照正向累加的方法将结果加和,这样至少不会出现你说的负数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-23 22:43:10
YLF870214 发表于 2016-12-14 16:31
你这样是无法用线性模型解决的,线性模型出来参数太死,而且很容易出现过拟合;如果是做预测的话,建议直接 ...
终于有人回了,我去

目前也是大致这么做的,不过我绕了个弯子,业务上避免了这种情形;
当时看来太钻牛角尖了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群