全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
7674 5
2018-08-10
这里分享一个R小技巧:实现分组筛选第1条、最后一条、或第n条记录。平时可能经常遇到一种问题,比如在不同省份不同性别中选取最近登录的记录,实质就是对省份、性别、登录时间排序,并选择最后一条记录,在sas、python甚至sql都有相关的函数可以快速实现该功能,比如sas有last/first,而R实现起来就比较麻烦,当然可以用sql的group by也是可以的,这里分享另一个技巧,搜索全网别无二家哦。
     简单结合order、aggregate函数和dplyr即可实现,代码如下:

复制代码

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-8-10 18:10:36
补充一下,这个好像效率比较低,sql还快一些
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-16 08:58:57
分享一个dplyr的方法,共同学习
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-16 09:04:05
上面的方法不够简练,这个似乎更好一些:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-17 10:26:49
felixzhao123 发表于 2018-8-16 09:04
上面的方法不够简练,这个似乎更好一些:
尝试了一下,这样筛选的会把重复的选进去
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-9-26 14:45:05
Pandas有没有类似这种的,分组后筛选第一条或前几条的功能
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群