现在有两个数据表,一个是染色体上的基因片段所在的位置,一个是结合在染色体上的RNA所在的位置。人体内23条染色体和两条性染色体的数据是乱序的,基因片段的数目和RNA的数目也不相等,如图:
我需要先判断基因和RNA是否在同一条染色体上,再对它们的位置进行比较,位置有交集的,则输出RNA的名字,我的代码是:
lncRNA<-read.csv("E:/THU_research_intern/lncRNA/data/2012data/lncRNA.csv",header=TRUE,stringsAsFactors = FALSE)
ChP<-read.csv("E:/THU_research_intern/lncRNA/data/2012data/GSM1436260_ENCFF002ENI.csv",header=TRUE,stringsAsFactors = FALSE)
ChP<-ChP[order(ChP[,1]),]
for(x in 1:2708)
for(i in 1:118484)
if(lncRNA[i,1]==ChP[x,1]&&lncRNA[x,3]<=ChP[i,2]||lncRNA[x,1]==ChP[i,1]&&lncRNA[x,2]>=ChP[i,6]) lncRNA=lncRNA[-c(i),]
lncRNA[,4]
错误信息是,
Error in if (lncRNA[i, 1] == ChP[x, 1] && lncRNA[x, 3] <= ChP[i, 2] || :
missing value where TRUE/FALSE needed
应该怎么写呢?