全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
6032 6
2015-10-23
我现在想写的一个宏的需求是这样的,有一张表,其中有3列,第一列是行业编号,第二列是和第三列分别是2个数值变量(后面分析使用到)。行业编号的取值水平有400多个(不固定,随时间在变化),每个取值水平有若干个观测(大多在180左右)
1:首先,我想把这张表按照行业编号的取值进行表拆分,拆分后的每个数据集以 ”ds_行业编号取值" 命名,这一步生成400多个行业数据集
2:对400个数据集的第二列和第三列进行0-1标准化( 公式:value-min/max-min )
3:对标准化后的数据集进一步处理

现在碰到的问题是第1步和第2步怎么用宏来写,数据集以SASHELP.PRDSAL2为例吧,假设PRODTYPE是行业编号,ACTUAL和PREDICT分别是第二列和第三列
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-23 23:11:03
没示例数据,想起来比较抽象~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-24 01:21:51
应该还有一列是时间
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-24 12:07:41
下面是实现拆分的,稍微改下就可以实现2、3,自己动手吧,输入数据集第一列必须为分类变量
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-9 16:24:36
木叶知秋 发表于 2015-10-24 12:07
下面是实现拆分的,稍微改下就可以实现2、3,自己动手吧,输入数据集第一列必须为分类变量
非常好,赞!谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-2-22 14:14:42
收下了  谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群