全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2873 3
2012-02-16
存在两个数据集,如何对一个数据集加weighting,来达到和第一个数据集的变量分布一致。具体例子,如下;数据集A:第一列panelist,第二列GROUPS,第三列INCOME。然后一共100条记录
panelistGroupsincome
10001602ADULT FAMILINCOME 3001-5000 RMB
10001603ADULT FAMILINCOME > 5000 RMB
10002003YOUNG FAMILYINCOME > 5000 RMB
10002101ADULT FAMILINCOME > 5000 RMB
10002103ADULT FAMILINCOME > 5000 RMB
10003305ADULT FAMILINCOME < 3000 RMB
10004503OLDER FAMILYINCOME > 5000 RMB
10004907YOUNG FAMILYINCOME > 5000 RMB
10007606ADULT FAMILINCOME > 5000 RMB
10007610ADULT FAMILINCOME 3001-5000 RMB
10007704YOUNG FAMILYINCOME > 5000 RMB
10008118ADULT FAMILINCOME > 5000 RMB
10008306YOUNG FAMILYINCOME > 5000 RMB
10008404OLD SINGLE/COUPLEINCOME 3001-5000 RMB
10008408OLDER FAMILYINCOME 3001-5000 RMB
10008412ADULT FAMILINCOME > 5000 RMB

数据集B也是一样的结构,不同的是,panelist不同。一共80条记录。我现在需要计算出数据集B的每个panelist的一个weight.比如
panelistGroupsincomeweight
10008716ADULT FAMILINCOME < 3000 RMB

1.2

10009106ADULT FAMILINCOME > 5000 RMB

1.3

10009111OLDER FAMILYINCOME > 5000 RMB

0.8

10009112YOUNG FAMILYINCOME 3001-5000 RMB

2.1

10009604ADULT FAMILINCOME > 5000 RMB

1.5

10009808OLDER FAMILYINCOME 3001-5000 RMB

0.3

10010709ADULT FAMILINCOME > 5000 RMB

2.3

10011009YOUNG FAMILYINCOME > 5000 RMB

0.1

10011204OLD SINGLE/COUPLEINCOME < 3000 RMB

1.5

10011206ADULT FAMILINCOME 3001-5000 RMB

1.2




计算weight的目的是让我
proc freq;
tables groups;
tables income;
run;
出来的结果两个数据集接近,类似。问题就是如何计算这个weight呢?????

跪等高手啊~~~~我有个基本思路就是用每个var里面每个值除以他所在值的总和,然后经过几次迭代之类的。最后模拟出一个最后的freq比较接近的。

求高手啊!!!!!!!!!!!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-20 11:49:18
顶一下~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-22 16:52:29
没人来回答啊???
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-22 23:23:50
没有理解。其实 PROC FREQ 的WEIGHT本质上是FREQUENCY,只认得整数。京剧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群