全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4662 6
2017-01-06
如果多变量重复值怎么判断呢?下列数据集df

id1 id2
1  2
1  2
1  3
2  2
2  2


  • 如果仅以id2去重复值会得到(下划线为删除了的行):      df[!duplicated(df$id2)]

id1 id2
1  2
1  2
1  3
2  2
2  2

  • 如果以id1和id2一起确定重复值,去重复值应该为(下划线为删除了的行):   这种怎么实现呢??

id1 id2
1  2
1  2
1  3
2  2
2  2

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-1-6 19:08:55
复制代码
捕获.PNG
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-6 19:43:43
zhou1_20 发表于 2017-1-6 19:08
StatMeasures 这个包貌似就是我一直想要的,有时间学习学习,非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-6 19:59:55
感觉R语言的分组统计、计算好麻烦哦,,,远远没有stata方便···
还是我没有掌握好用的工具包??
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-6 23:39:05
皖山一流 发表于 2017-1-6 19:59
感觉R语言的分组统计、计算好麻烦哦,,,远远没有stata方便···
还是我没有掌握好用的工具包??
那是因为你对R还不够熟悉。
R基础包中自带的
unique(df)
就能解决你的问题。
当然,如果你的数据是上千万行的数据,最好用:
dplyr::distinct(df)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-7 10:07:02
cheetahfly 发表于 2017-1-6 23:39
那是因为你对R还不够熟悉。
R基础包中自带的
unique(df)
是这样,还有待学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群