全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2555 2
2018-11-22
类似FAMA模型的factor构建

code

date

closeb

close

MV

pe

epreturn
000001.SZ1999012.89882.82462245522742129.37860.034038382-0.025596799
000001.SZ1999022.82462.65282108960198027.59190.03624252-0.060822771
000001.SZ1999032.65282.67242124478668927.7950.0359776940.00738842
data 数据大概是这样
要求先将数据按日期分组,
然后对每个日期组内的数据按ep排序分为最小30%G组,中间40%M组,最大30%V组  
然后再将每组内的数据按MV排序分为最大50%B组,最小50%S组
这样分得6组

怎么样可以实现呢?这样分组后又如何调用某一组数据比如调用 所有G组中的B组数据,求其均值
单次分组可以用filter实现,两次分组不太会
求大神解答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-11-22 20:28:42
学会 dplyr 包  就会了。。
   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-11-23 16:57:34
加两个辅助变量,size and value,用quantile函数标出30%,40%,30%的组,求交叉组均值,相减。用data.table更快、更简单
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群