全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1867 3
2015-05-04
从第一位截取,每次截取长度为4个碱基的短串,生成一系列短串,然后查找要查找短串在所有短串中的位置,数据如下:
1.TTTCCTTTTTTTGAACAGATGATTTTAGTGAGCACTGCGCTAGGAGTATGTGTTGAATCTCCAACCCTCGGAACATAGTCGTTGCTCTTGCGGACTGAGA
2.GGAATCTGCAACTCGGATGGCCGTCTCAAGTAAGCAACAACATTGTTGCTTGCGGCTTCCCGGGTGTCGCTAAGCGTTTAAAAAGTTGTTAGGATTAACC
3.CTCTTTCTACCTAATGGTGAAATTCGCGAGAGAACGATTAGACACGCCGCGCTGATGGGCAGGAGTGTTTGCACTCGATGAATCCCTCGACTGGGACCGG
要求按行截取,查找结果也按行显示
比如说第几行第几位。
假如我要查找ATCG,结果应该是:
ATCG 1[2  5  9  14..............]
         2[2   8   19    26..........]
我现在能做出来,但是不能按行查找。
求大神指教!急急急!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-5-4 23:42:17
这是个经济学论坛 你不觉得你这个问题到bioconductor上去问更合适么
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-5 00:40:24
是要输出这样的结果吗#从第一位截取,每次截取长度为4个碱基的短串,生成一系列短串
> data1
    [,1]   [,2]   [,3]   [,4]   [,5]   [,6]   [,7]   [,8]   [,9]   [,10]  [,11]  [,12]  [,13]  [,14]  [,15]
tmp "TTTC" "CTTT" "TTTT" "GAAC" "AGAT" "GATT" "TTAG" "TGAG" "CACT" "GCGC" "TAGG" "AGTA" "TGTG" "TTGA" "ATCT"
tmp "GGAA" "TCTG" "CAAC" "TCGG" "ATGG" "CCGT" "CTCA" "AGTA" "AGCA" "ACAA" "CATT" "GTTG" "CTTG" "CGGC" "TTCC"
tmp "CTCT" "TTCT" "ACCT" "AATG" "GTGA" "AATT" "CGCG" "AGAG" "AACG" "ATTA" "GACA" "CGCC" "GCGC" "TGAT" "GGGC"
    [,16]  [,17]  [,18]  [,19]  [,20]  [,21]  [,22]  [,23]  [,24]  [,25]
tmp "CCAA" "CCCT" "CGGA" "ACAT" "AGTC" "GTTG" "CTCT" "TGCG" "GACT" "GAGA"
tmp "CGGG" "TGTC" "GCTA" "AGCG" "TTTA" "AAAA" "GTTG" "TTAG" "GATT" "AACC"
tmp "AGGA" "GTGT" "TTGC" "ACTC" "GATG" "AATC" "CCTC" "GACT" "GGGA" "CCGG"
#查找要查找短串"GTTG"在所有短串中的位置
> result
[[1]]
[1] 21

[[2]]
[1] 12 22

[[3]]
integer(0)


代码如下


复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-5 05:34:00
lapply(gregexpr("ATCG", c("ATCGATCG","ATCGTCGA", "AAAAAAAA")), function(x) x[x %% 4 == 1])
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群