全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4037 7
2017-06-08
悬赏 15 个论坛币 未解决
啊~又遇到点问题,大概知道怎么做回归但是不是很清楚怎么去分类回归


具体是这样,如上图,大家看到的那样,有year, month, CCI, Gasrate, UR, Park, visits, lag, d1一直到d12,trend(后面一些截不了图)

然后这些数据是按照每个park,也就是每个公园,每个月的跟踪数据,从1992年一直到2016年,
然后希望做一个如下的回归:
Visits =  trend d1-d11 lag_visits unemployment gas consumer_confidence;

然后我的代码是:
proc reg data=cm plots=none;
model Recreation_Visits= trend d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 d12 lag UR  Gasrate cci;
run;

但是这样的问题是一个一个算的,我怎么样才能按照每个公园来算啊,就是想用这些数据,对每个公园做回归,每一个公园作为一个整体(就是一个公园用一个回归公式,12个月25年用相对应的数据做,别的公园,又为一组这样..),公园大概有好几十个...?应该by park么?
我弄了好久都一直在报错....求大神指导...我在这里万分谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-8 11:00:09
啊对了,我补充一下,d1=1是1月,d2=1是2月,d3=1是三月,以此类推
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-8 11:20:40
编辑更正:Proc reg里是不能对一个非连续变量像逻辑回归那样用class来区分类别来回归的,这违背了线性回归针对连续性变量的初衷。

你的问题,一定要有一个变量来记录不同公园的名字或者代号ID,比如叫Park。然后在数据导入回归之前就用group by之类的sql语句按分类做好对应公园的相应子数据集。最后用宏来实现载入不同数据集输入到proc reg里。

另:我不大认同你这样把月份数据一股脑丢进去做线性拟合的方法,统计上意义何在?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-8 11:35:52
foocares 发表于 2017-6-8 11:20
编辑更正:Proc reg里是不能对一个非连续变量像逻辑回归那样用class来区分类别来回归的,这违背了线性回归针 ...
那proc glm呢,还有您这里所说的要一个变量来记录不同的公园名字我应该怎么去理解呢,比如,公园A设1公园B设2么?还有您所说的月份数据是指?哪一个?
就是想看看这些对visit的量有什么作用.....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-8 12:02:15
proc glm倒是可以调用class。
你不是把d1到d12的数据全当自变量扔进去了吗,我觉得本质上没有什么统计意义。每个月的数据更像一个时间序列,没有内在的关系驱动,所以拟合不出什么有意义的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-8 12:07:33
foocares 发表于 2017-6-8 12:02
proc glm倒是可以调用class。
你不是把d1到d12的数据全当自变量扔进去了吗,我觉得本质上没有什么统计意义 ...
哦,那个dummy,我问了老师,老师建议我这么做,就打算先放着
还有一个问题glm调用class以后按照公园数,每个公园都出一张表格么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群