全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2239 5
2016-04-16
如题,通过用户id匹配数据后,出现了重复行的情况,但这些重复行中所包含的信息是不同的,所以我想请教下如何在保留最多数据信息的情况下将其他的重复行删掉?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-4-16 19:54:09
1.先对这个最多用用户信息作一个定义
2.根据这个定义,建立一个筛选机制
3.构建辅助变量,确定进一步删留数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-16 20:45:28
jiangbeilu 发表于 2016-4-16 19:54
1.先对这个最多用用户信息作一个定义
2.根据这个定义,建立一个筛选机制
3.构建辅助变量,确定进一步删留 ...
您好,可否给些代码的提示呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-16 21:00:29
不知道你的用户信息定义,不好给代码啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-16 21:36:36
jiangbeilu 发表于 2016-4-16 21:00
不知道你的用户信息定义,不好给代码啊
可以留个联络方式,我将数据发给您,进一步请教么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-17 00:32:53
我觉得你是在合并数据的时候,Key列的数据有重复。建议在每个数据表格合并前,分别检查一下join字段是否是unique。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群