全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2176 9
2009-07-17
以前的同事问了一个问题,我也不太确定用什么方法,请大家帮我看看:
data test;
input user_id date v1 v2;
cards;
101 200801 0.5 0.4
101 200802 0.2 0.3
101 200803 0.3 0.1
101 200804 0.4 0.5
101 200805 0.3 0.6
101 200806 0.1 0.4
101 200807 0.7 0.3
101 200808 0.8 0.8
101 200809 0.6 0.9
102 200801 0.6 0.6
102 200802 0.9 0.7
102 200803 0.3 0.8
102 200804 0.4 0.1
102 200805 0.3 0.2
102 200806 0.6 0.5
102 200807 0.5 0.4
102 200808 0.7 0.3
102 200809 0.5 0.8
;
run;


需求如下:如果我想知道两个变量V1V2是否在时间上(字段为date)存在序列相关(一阶;二阶;等等),怎么实现这个需求?其中user_id表示不同的客户.希望能给出具体的解答方案,不要三言两语。不胜感激!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-7-17 16:59:17
沙发耶 这个很难吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-17 17:19:48
daliang1010 发表于 2009-7-17 16:59
沙发耶 这个很难吗
这个可是版主提的,是用lag和dif函数么?分别做四次相关
这个是滞后
V1: lag(V2)
V1: lag(lag(V2))
V2:lag(V1)
V2:lag(lag(V1))

这个是差分
V1: dif(V2)
V1: dif(dif(V2))
V2:dif(V1)
V2:dif(dif(V1))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-17 17:21:00
您是想研究两个变量间的相关关系  还是 它们作为一个整体是否存在时间上的序列相关 ?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-17 17:47:17
BZ 大人:

您老人家是想 分别考察 v1、v2 两变量 各自在时间上是否存在 自相关, 或是考察两者之间是否存在相关关系?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-17 18:19:39
可能是我没有表达好,有两点:
第一:是变量之间的相关,但是可能是一阶相关,二阶相关,。。。。
第二:如果仅仅考虑这两个变量的时间序列相关,那非常简单,正如楼上sushe1527所写,用比较愚蠢的办法lag函数搞定。但是请大家一定要考虑到user_id.
目前我想到的一个方法是把所有的user_id做group取平均,然后用lag函数,但是最大的issue是这些user_id实际上有可能不是完全独立的,比如按照性别来看,其中可能男性的user_id对应的V1和V2从总体上要比女性高,最后我们还不得不回到user_id这个lever上来。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群