全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1901 4
2021-03-27
多行数据ID列的值相同,如何根据Length列中的最大值(该列中存在多个数据为最大值),去除重复的ID值,仅保留一个Length最大 且 ID唯一的整行数据。数据如图所示,对于EntrezGeneID1该列数据,红框为ID值重复的行,希望是仅保留Length1为最大的一行数据,如黑框标出的数据。(不一定为第一个,任选Length1的值为最大值的一行数据即可)。

请大神指教!十分感谢!
data.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-3-28 07:06:50
你可以用dplyr来完成,见例子
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-28 13:54:49
owenqi 发表于 2021-3-28 07:06
你可以用dplyr来完成,见例子
newGS<-df %>% group_by(EntrezGeneID1) %>% filter(Length1==max(Length1)) #这样直接些
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-29 15:16:50
owenqi 发表于 2021-3-28 07:06
你可以用dplyr来完成,见例子
好的,谢谢大神指教!让我更加熟悉dplyr包的相关方法。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-29 15:18:57
llb_321 发表于 2021-3-28 13:54
newGS% group_by(EntrezGeneID1) %>% filter(Length1==max(Length1)) #这样直接些
感谢大神指导!写法上的确更简洁明了,便于新手了解代码。十分感谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群