全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
700 14
2015-03-12
悬赏 120 个论坛币 已解决
这里有个城市 city,郡 county,和邮政编码 zip code 的数据归纳问题,实际数据量有上万,分类有上千,但是用这个sample data 求解分类方法。

具体要用sas 做,应该用到array 等方程,写的不熟不能用。Excel 太耗时间。
数据 处理.xlsx
大小:(18.26 KB)

 马上下载



第一个tab 是原始 sample data, 第二个是理想的结果,这样便于我进行下一步操作。

最好最快最全的SAS 程序将得到最终120金币奖励。 谢谢。

最佳答案

yongyitian 查看完整内容

1. 宏变量的长度可以用 mvarsize= system option 定义。 但有最大值(65534)限制. 一个数据步中可以用多个label语句。可以考虑按照code的排序用where条件将label的宏变量分成几个长度小于65000的宏 变量。 当然还需要提前估算每一个label的长度。可以根据数据调整下面的code。2. array 变量长度 _$15. _$20. _$20. 是大于原数据中的变量长度的(code_$5., city_$10., county_$12.)。测试过如果 用原数据中的变量长度ci ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-12 11:00:01
reduce_fat 发表于 2015-3-15 06:56
你好,我的数据比较大,在修改了你的codes 后,出现两个问题。一个是label_zip 的 macro 变量太长,超出 ...
1.
宏变量的长度可以用 mvarsize= system option 定义。 但有最大值(65534)限制.
一个数据步中可以用多个label语句。可以考虑按照code的排序用where条件将label的宏变量分成几个长度小于65000的宏

变量。 当然还需要提前估算每一个label的长度。可以根据数据调整下面的code。
复制代码
2.
array 变量长度 _$15. _$20. _$20. 是大于原数据中的变量长度的(code_$5., city_$10., county_$12.)。测试过如果

用原数据中的变量长度city name 和county name可能会被截断。
建议选则大于proc contents 列出的长度.

3.
把前面的程序改成了只包含两个变量, 主要是最后一个datastep.
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-12 13:03:05
求高手解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-12 13:22:37
亲 为何还有下载权限呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-12 16:16:44
用summary过程应该就可以了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-12 21:46:47
pony_liu 发表于 2015-3-12 13:22
亲 为何还有下载权限呢
为了避免灌水,你如果会,我可以降低权限。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群