全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2627 20
2018-05-06
数据格式如下:
1 E00548:177:HKH53CCXY:4:1101:10003:10029 TACAGACTGTGG    CTCTCCTATAGC    chr2    184106244       184106312
2 E00548:177:HKH53CCXY:4:1101:10003:10099 TGATACCGGACA    GTGCCTCATCTA    chr3    139790591       139790643
3 E00548:177:HKH53CCXY:4:1101:10003:10099 TGATACCGGACA    GTGCCTCATCTA    chr3    139790643       139790591
4 E00548:177:HKH53CCXY:4:1101:10003:10169 CTTCCATAGGCA    AGAGTTCACGGA    chr6    26713971        26713996
5 E00548:177:HKH53CCXY:4:1101:10003:10169 CTTCCATAGGCA    AGAGTTCACGGA    chr6    26713996        26713971
6 E00548:177:HKH53CCXY:4:1101:10003:10240 TAGACGTAGACG    TCAAGGAGAACC    chr14   37255539        37255588
7 E00548:177:HKH53CCXY:4:1101:10003:10240 TCAAGGAGAACC    TAGACGTAGACG    chr14   37255588        37255539
8 E00548:177:HKH53CCXY:4:1101:10003:15795 ACGACACTGCTA    CTCTCCTATAGC    chr14   96799778        96799778
9 E00548:177:HKH53CCXY:4:1101:10003:10029 CTCTCCTATAGC    TACAGACTGTGG    chr2    184106312       184106244



(第一列的序号是自己加的,原文件中没有)
比如第6、7行,他们的第2、3列顺序相反,第5、6列顺序也刚好相反,其余的字段内容相同
以及第1、9行,也是第2、3列顺序相反,第5、6列顺序也刚好相反,其余的字段内容相同
1.txt
大小:(1.43 KB)

 马上下载



现在想要把这种成对的两行输出到一个文件,例如上述数据的输出结果应该是:
E00548:177:HKH53CCXY:4:1101:10003:10029 TACAGACTGTGG    CTCTCCTATAGC    chr2    184106244       184106312
E00548:177:HKH53CCXY:4:1101:10003:10029 CTCTCCTATAGC    TACAGACTGTGG    chr2    184106312       184106244
E00548:177:HKH53CCXY:4:1101:10003:10240 TAGACGTAGACG    TCAAGGAGAACC    chr14   37255539        37255588
E00548:177:HKH53CCXY:4:1101:10003:10240 TCAAGGAGAACC    TAGACGTAGACG    chr14   37255588        37255539






数据比较大,有没有什么简单一点的方法快速找到想要的数据对?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-5-6 15:02:35
library(dplyr)

data001=read.table('1.txt')
head(data001)
glimpse(data001)
data002=data001%>%mutate(new_v23_a=paste(V2,V3),new_v23_b=paste(V3,V2)
                         ,new_v56_a=paste(V5,V6),new_v56_b=paste(V6,V5)
                         )%>%mutate(V23_flag=ifelse(new_v23_a %in% new_v23_b,1,0)
                         ,V56_flag=ifelse(new_v56_a %in% new_v56_b,1,0)
                         )%>%filter(V23_flag==1,V56_flag==1)                                       
                                       

data002   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-6 16:17:16
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-6 16:26:01
rainningpoet 发表于 2018-5-6 15:02
library(dplyr)

data001=read.table('1.txt')
额,谢谢,试了一下,找是找出来了,但是结果还是有点问题啊:
E00548:177:HKH53CCXY:4:1101:10003:10029 TACAGACTGTGG    CTCTCCTATAGC    chr2    184106244       184106312       TACAGACTGTGG CTCTCCTATAGC       CTCTCCTATAGC TACAGACTGTGG    184106244 184106312     184106312 184106244     1       1
E00548:177:HKH53CCXY:4:1101:10003:10240 TAGACGTAGACG    TCAAGGAGAACC    chr14   37255539        37255588        TAGACGTAGACG TCAAGGAGAACC       TCAAGGAGAACC TAGACGTAGACG    37255539 37255588       37255588 37255539       1       1
E00548:177:HKH53CCXY:4:1101:10003:10240 TCAAGGAGAACC    TAGACGTAGACG    chr14   37255588        37255539        TCAAGGAGAACC TAGACGTAGACG       TAGACGTAGACG TCAAGGAGAACC    37255588 37255539       37255539 37255588       1       1
E00548:177:HKH53CCXY:4:1101:10003:10029 CTCTCCTATAGC    TACAGACTGTGG    chr2    184106312       184106244       CTCTCCTATAGC TACAGACTGTGG       TACAGACTGTGG CTCTCCTATAGC    184106312 184106244     184106244 184106312     1       1
E00548:177:HKH53CCXY:4:1101:10003:17272 AGCGGATGAGTA    AGCGGATGAGTA    chr15   80282260        80282316        AGCGGATGAGTA AGCGGATGAGTA       AGCGGATGAGTA AGCGGATGAGTA    80282260 80282316       80282316 80282260       1       1
E00548:177:HKH53CCXY:4:1101:10003:17272 AGCGGATGAGTA    AGCGGATGAGTA    chr15   80282316        80282260        AGCGGATGAGTA AGCGGATGAGTA       AGCGGATGAGTA AGCGGATGAGTA    80282316 80282260       80282260 80282316       1       1

为什么后面多了这么多列?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-6 16:27:03
rainningpoet 发表于 2018-5-6 15:02
library(dplyr)

data001=read.table('1.txt')
结果为什么多了这么多列?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-6 16:31:24
zhou1_20 发表于 2018-5-6 16:17
object 'dtV3' not found
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群