全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3368 3
2010-12-16
求教高手:

我有大约40m的数据样本,每行数据有包括时间(日),股票代码,流通市值,价格等18个属性。


现在需要在数据上计算,将每天的股票进行分类:
1、按照规模分类:将股票按照每天流通市值排序后等分成小盘股、中盘股、大盘股三类。
2、按照价格分类:将股票价格前收盘价从小到大排列,然后等比例分成低价股、中价股、高价股三类。
3、按照业绩分类:将股价按上年度的每股收益率(每股收益除以平均股价)从小到大排序后,将小于零的归为负业绩类,大于零的按照30%70%的比例分成低、中、高3类。
4、按照市盈率分类:将年度内的前一交易日市盈率从小到大排序后按30%70%的比例分成低、中、高和其他共4类,其中其他类是指市盈率为负或者市盈率缺失的股票。
5、对ST股票的持股:将股票分为ST股票和非ST股票两类。

就是说,首先按照时间(有半年)分类,然后对每天的情况,按照流通市值,价格和业绩等排序再分类,分别赋一个值1,2或者3(按照排位在前 中 后的位置,例如 深发展A在2009年6月4日流通市值排在1/3,则给2009年6月4日的深发展A赋予一个新的属性1,名称为流通市值排名,其他的类似。

因为样本太大,用其他软件没法进行运算,只能求助SAS,但是我本人对SAS一点了解都没有,所以求教一下大家!

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-12-16 13:08:13
这样说太抽象,在数据上说比较好明白!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-16 13:49:43
不用排序
用proc  univariate计算一下百分位数即可。然后根据百分位数进行变量各个层次的分组
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-16 13:52:34
对SAS来说这个样本量不算大样本,还不比考虑效率和空间问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群