R 数据框中多行数据ID列的值相同，如何根据Length列中的最大值去除重复ID数据 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛

R 数据框中多行数据ID列的值相同，如何根据Length列中的最大值去除重复ID数据

2013

4

收藏 2021-03-27

多行数据ID列的值相同，如何根据Length列中的最大值(该列中存在多个数据为最大值)，去除重复的ID值，仅保留一个Length最大且 ID唯一的整行数据。数据如图所示，对于EntrezGeneID1该列数据，红框为ID值重复的行，希望是仅保留Length1为最大的一行数据，如黑框标出的数据。（不一定为第一个，任选Length1的值为最大值的一行数据即可）。

请大神指教！十分感谢！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2021-3-28 07:06:50

你可以用dplyr来完成，见例子

复制代码

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2021-3-28 13:54:49

owenqi 发表于 2021-3-28 07:06
你可以用dplyr来完成，见例子

newGS<-df %>% group_by(EntrezGeneID1) %>% filter(Length1==max(Length1)) #这样直接些

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2021-3-29 15:16:50

owenqi 发表于 2021-3-28 07:06
你可以用dplyr来完成，见例子

好的，谢谢大神指教！让我更加熟悉dplyr包的相关方法。谢谢！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2021-3-29 15:18:57

llb_321 发表于 2021-3-28 13:54
newGS% group_by(EntrezGeneID1) %>% filter(Length1==max(Length1)) #这样直接些

感谢大神指导！写法上的确更简洁明了，便于新手了解代码。十分感谢！！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群