经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
SAS专版
【求教】如何对一个大样本数据进行排序
楼主
ydwkiller
3368
3
收藏
2010-12-16
求教高手:
我有大约40m的数据样本,每行数据有包括时间(日),股票代码,流通市值,价格等18个属性。
现在需要在数据上计算,
将每天的股票进行分类:
1
、按照规模分类:
将股票按照每天流通市值排序后等分成小盘股、中盘股、大盘股三类。
2
、按照价格分类:
将股票价格前收盘价从小到大排列,然后等比例分成低价股、中价股、高价股三类。
3
、按照业绩分类:
将股价按上年度的每股收益率(
每股收益除以平均股价
)从小到大排序后,将小于零的归为负业绩类,大于零的按照
30%
、
70%
的比例分成低、中、高
3
类。
4
、按照市盈率分类:
将年度内的前一交易日市盈率从小到大排序后按
30%
、
70%
的比例分成低、中、高和其他共
4
类,其中其他类是指市盈率为负或者市盈率缺失的股票。
5
、对
ST
股票的持股:
将股票分为
ST
股票和非
ST
股票两类。
就是说,首先按照时间(有半年)分类,然后对每天的情况,按照流通市值,价格和业绩等排序再分类,分别赋一个值1,2或者3(按照排位在前 中 后的位置,例如 深发展A在2009年6月4日流通市值排在1/3,则给2009年6月4日的深发展A赋予一个新的属性1,名称为流通市值排名,其他的类似。
因为样本太大,用其他软件没法进行运算,只能求助SAS,但是我本人对SAS一点了解都没有,所以求教一下大家!
谢谢!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
zc.1984
2010-12-16 13:08:13
这样说太抽象,在数据上说比较好明白!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
论坛数据分析
2010-12-16 13:49:43
不用排序
用proc univariate计算一下百分位数即可。然后根据百分位数进行变量各个层次的分组
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
论坛数据分析
2010-12-16 13:52:34
对SAS来说这个样本量不算大样本,还不比考虑效率和空间问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
如何进行重复抽样
超过10万以上的大样本数据用哪个软件进行计量分析比较好
关于样本数据有限的问题
在R软件中如何编程实现两列大样本数据中每个样本的差异大小
两个大样本数据之间的两两计算
请教大样本数据的SFA如何处理?
大样本数据评价方法探讨!求助!
如何做样本数据与特定参数的GED分布的对比图?
为什么模型与样本数据不契合????
stata做dea分析结果
栏目导航
SAS专版
爱问频道
金融实务版
计量经济学与统计软件
经管文库(原现金交易版)
经管高考
热门文章
CDA考试模拟题库:新增章节练习题(更新于1 ...
文本分析:从经管顶刊“加分项”到学术发表 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CAIE人工智能工程师认证
哈耶克作品集 6本 含通往奴役之路、自由宪章 ...
博观研究院2025年中国跨境进口保健品市场分 ...
南大CSSCI(2025-2026)来源期刊目录及扩展版
PromptCoT-2.0-SFT-4.8M 监督微调提示 SFT ...
货币--是如何产生成长发展的和人类的四大工 ...
【详细整理,24重磅!】1990-2024上市公司市场 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群