经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
SAS专版
【求教】如何对一个大样本数据进行排序
楼主
ydwkiller
3448
3
收藏
2010-12-16
求教高手:
我有大约40m的数据样本,每行数据有包括时间(日),股票代码,流通市值,价格等18个属性。
现在需要在数据上计算,
将每天的股票进行分类:
1
、按照规模分类:
将股票按照每天流通市值排序后等分成小盘股、中盘股、大盘股三类。
2
、按照价格分类:
将股票价格前收盘价从小到大排列,然后等比例分成低价股、中价股、高价股三类。
3
、按照业绩分类:
将股价按上年度的每股收益率(
每股收益除以平均股价
)从小到大排序后,将小于零的归为负业绩类,大于零的按照
30%
、
70%
的比例分成低、中、高
3
类。
4
、按照市盈率分类:
将年度内的前一交易日市盈率从小到大排序后按
30%
、
70%
的比例分成低、中、高和其他共
4
类,其中其他类是指市盈率为负或者市盈率缺失的股票。
5
、对
ST
股票的持股:
将股票分为
ST
股票和非
ST
股票两类。
就是说,首先按照时间(有半年)分类,然后对每天的情况,按照流通市值,价格和业绩等排序再分类,分别赋一个值1,2或者3(按照排位在前 中 后的位置,例如 深发展A在2009年6月4日流通市值排在1/3,则给2009年6月4日的深发展A赋予一个新的属性1,名称为流通市值排名,其他的类似。
因为样本太大,用其他软件没法进行运算,只能求助SAS,但是我本人对SAS一点了解都没有,所以求教一下大家!
谢谢!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
zc.1984
2010-12-16 13:08:13
这样说太抽象,在数据上说比较好明白!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
论坛数据分析
2010-12-16 13:49:43
不用排序
用proc univariate计算一下百分位数即可。然后根据百分位数进行变量各个层次的分组
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
论坛数据分析
2010-12-16 13:52:34
对SAS来说这个样本量不算大样本,还不比考虑效率和空间问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
如何进行重复抽样
超过10万以上的大样本数据用哪个软件进行计量分析比较好
关于样本数据有限的问题
在R软件中如何编程实现两列大样本数据中每个样本的差异大小
两个大样本数据之间的两两计算
请教大样本数据的SFA如何处理?
大样本数据评价方法探讨!求助!
如何做样本数据与特定参数的GED分布的对比图?
为什么模型与样本数据不契合????
stata做dea分析结果
栏目导航
SAS专版
Excel
经管在职研
宏观经济学
哲学与心理学版
学道会
热门文章
我该如何记住你?智能体记忆系统的演化之路
CDA数据分析脱产就业班于2026年3月7日开班! ...
无上高明的“无为”“无住”哲学在传统中国
新宏观丨中美经济总量差距拉大的根源
艾瑞咨询 - 2025年中国早教行业白皮书
第一太平戴维斯 - 2026年中国房地产市场展望 ...
2025中国居民退休准备指数调研报告-清华大学 ...
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
精准匹配,菁英相伴--经管之家单身俱乐部, ...
CDA数据分析师:商业数据分析实践的核心执行 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群