R语言按条件筛选数据

ㄣ雨珩碸啉

10082

收藏 2016-08-11

现在需要按 “机构1”这个字段进行筛选，比如101200出现了两次，首先按照群组长度筛，保留群组长度大的，如果群组长度一样，则保留序号小的，也就是排在前面的。最后的结果见第二张表，求大神指导

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

cmwei333

2016-8-11 10:05:24

代码部分：
# reproduce your data, igoring the last 2 columns
c1 <- c(1:12)
c2 <- rep(5,12)
c2[7:8] <- 6
c3 <- c(23,23,21,20,20,19,rep(16,4),15,15)
c4 <- rep(101100,12)
c4[1:2] <- 101200
c4[c(7,11,12)] <- 105800
c4[8] <- 101700
data <- matrix(c(c1,c2,c3,c4),ncol=4)

# selection procedure
c4sel <- unique(data[,4])
vecf <- NULL  # initiate final selected data in vector form
for(i in 1:length(c4sel)){
sel1 <- data[data[,4]==c4sel,]
if (!is.vector(sel1)){
sel2 <- sel1[sel1[,3]==max(sel1[,3]),]
if (!is.vector(sel2)){
sel3 <- sel2[sel2[,1]==min(sel2[,1]),]
vecf <- c(vecf,sel3)
} else {
vecf <- c(vecf,sel2)
}
} else {
vecf <- c(vecf,sel1)
}
}
dataf <- matrix(vecf,ncol=4,byrow=T)

运行结果：
> # reproduce your data, igoring the last 2 columns
> c1 <- c(1:12)
> c2 <- rep(5,12)
> c2[7:8] <- 6
> c3 <- c(23,23,21,20,20,19,rep(16,4),15,15)
> c4 <- rep(101100,12)
> c4[1:2] <- 101200
> c4[c(7,11,12)] <- 105800
> c4[8] <- 101700
> data <- matrix(c(c1,c2,c3,c4),ncol=4)
> data
   [,1] [,2] [,3] [,4]
[1,] 1 5 23 101200
[2,] 2 5 23 101200
[3,] 3 5 21 101100
[4,] 4 5 20 101100
[5,] 5 5 20 101100
[6,] 6 5 19 101100
[7,] 7 6 16 105800
[8,] 8 6 16 101700
[9,] 9 5 16 101100
[10,] 10 5 16 101100
[11,] 11 5 15 105800
[12,] 12 5 15 105800
>
> # selection procedure
> c4sel <- unique(data[,4])
> vecf <- NULL  # initiate final selected data in vector form
> for(i in 1:length(c4sel)){
+ sel1 <- data[data[,4]==c4sel,]
+ if (!is.vector(sel1)){
+ sel2 <- sel1[sel1[,3]==max(sel1[,3]),]
+ if (!is.vector(sel2)){
+ sel3 <- sel2[sel2[,1]==min(sel2[,1]),]
+ vecf <- c(vecf,sel3)
+ } else {
+ vecf <- c(vecf,sel2)
+ }
+ } else {
+ vecf <- c(vecf,sel1)
+ }
+ }
> dataf <- matrix(vecf,ncol=4,byrow=T)
> dataf
   [,1] [,2] [,3] [,4]
[1,] 1 5 23 101200
[2,] 3 5 21 101100
[3,] 7 6 16 105800
[4,] 8 6 16 101700
>

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

藤椅

ㄣ雨珩碸啉

2016-8-11 10:33:21

cmwei333 发表于 2016-8-11 10:05
代码部分：
# reproduce your data, igoring the last 2 columns
c1
我靠，只能膜拜啊，大神

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

板凳

好人3805

2016-8-11 14:09:39

假设你的data=d
d1 = d[order(d$机构1,d$群组长度,d$序号,decreasing=c(F,T,F)),]
last=0
index=1
result=0
for(i in 1:nrow(d1)){
cur = d1[i,4]
if(cur!=last)
{
result[index]=i
index = index + 1
last = cur
}
}
d2=d1[result,]
d2[order(d2[,1]),]

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

求助，怎样按条件筛选数据

请求帮忙，按照条件筛选数据

关于R语言筛选数据

关于如何根据某一条件筛选数据的问题

请教如何对数据框进行多条件筛选数据

请问一下R语言怎么筛选数据

SAS如何根据数据集A中字段的条件筛选数据集B中的结果

R语言如何按条件筛选循环定义新的数据和数据名称（R语言，循环）

R语言条件筛选的问题

R语言如何按某一字段的特定条件筛选、删除行

栏目导航

R语言论坛

经管文库（原现金交易版）

LATEX论坛

休闲灌水

真实世界经济学(含财经时事)

新手入门区

热门文章

CDA数据分析脱产就业班于2026年3月7日开班！ ...

表格结构数据的核心特征及具象实例解析

湖南统计年鉴2025（Excel版）

2026太空算力发展研究报告

中国提振消费的战略选择与国际经验，提振消 ...

Measure Theory for Analysis and Probabil ...

下载到假资源如何退单

高教现代数学基础23 矩阵计算六讲徐树方,钱 ...

【24顶刊热点!】2000-2024上市公司股价崩盘 ...

安徽全省一盘棋发力汽车产业

推荐文章

2026JG学术冬训营:从Stata初高到Python机器 ...

【必看】【本版版规，欢迎发悬赏贴求助】

26年寒假天津站｜Gemini论文写作&数据分析 ...

关于如何利用文献的若干建议

关于学术研究和论文发表的一些建议

关于科研中如何学习基础知识的一些建议 (一 ...

一个自编的经济学建模小案例 --写给授课本科 ...

AI智能体赋能教学改革: 全国AI教育教学应用 ...

2025中国AIoT产业全景图谱报告-406页

关于文献求助的一些建议

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群