for循环问题，求朋友们指点

2457

收藏 2020-04-15

大家好，遇到for循环问题，求朋友们指点，多谢！目的：查找向量miR.signature中的元素是否出现在数据集GSE13937、GSE102286的 'X.ID_REF.'列（第1列）中

问题：
1.第2段的for循环不知是否得到预期结果、第3段的for循环确定没得到预期结果：GSE102286[, 'X.ID_REF.']里面是有'hsa-mir-605', 'hsa-mir‐629'的（能匹配上），在第4段代码中也能得到证实，为什么用第3段的for循环得不出结果？
2.我的代码里，对两个数据集GSE13937、GSE102286是各自运行一遍代码，能否也写个循环，一步搞定？这样的话，两个数据集GSE13937、GSE102286需要先合并成list吗？
3.结果是否应该保存在list里面，这样能够看到具体哪个元素在哪个数据集的第1列中匹配上了？
4.第1段的for循环，是否也能嵌套在一起？

数据已上传至网盘
链接: https://pan.baidu.com/s/1wZH0c3SIQmoLON_qtHjqvg 提取码: mnjj
再次感谢大家！

for.match.rar
大小:(1.47 MB)

马上下载

本附件包括：

for.match.R
GSE102286_series_matrix.txt
GSE13937_series_matrix.txt

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

llb_321

2020-4-15 18:41:46

第一题，print(grep('miR.pattern[j]', 改成print(grep(miR.pattern[j],试试。miR.pattern[j]的值已经是一个字符串了，就是你要检索的，你再加个引号，那你定位的是引号里的内容，而不是这个东西所代表的值。
第二题，只有两个数据集，何必再费劲多写一个循环呢，又不是写以后经常用到的函数，只要能解决问题就好。
第三题，输出结果，看你自己需要啊。
第四题，你第一个for，只是为了调整向量数据的格式，不需要嵌套。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

EveIOU

2020-4-15 21:11:30

llb_321 发表于 2020-4-15 18:41
第一题，print(grep('miR.pattern[j]', 改成print(grep(miR.pattern[j],试试。miR.pattern[j]的值已经是一个 ...

多谢朋友指点，前进了一大步，还差一点点。请您再看一下吧，多谢！第二题，目前是只有两个数据集，怕以后数据集比较多，所以还是想写个循环，还望指点，多谢！

第一题，去掉引号之后是这样的结果

感觉理想的结果应该是这样
character(0)
character(0)
character(0)
character(0)
[1] "\"hsa-miR-605\""

[1] "\"hsa-miR-629\""

去掉引号之前是这样的结果

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

drunkfish69

2020-4-15 21:41:36

key <- c('hsa-mir-3607', 'hsa-mir-3677', 'hsa-mir-4661', 'hsa-mir-548v',
      'hsa-mir-605', 'hsa-mir‐629')
miR.signature <- as.data.frame(key)

GSE13937 <- read.table(
  file = "./for.match/GSE13937_series_matrix.txt",
  header = T, sep = "\t", fill = T,
  comment.char = "!"
)
GSE102286 <- read.table(
  file = "./for.match/GSE102286_series_matrix.txt",
  header = T, sep = "\t", fill = T,
  comment.char = "!"
)

GSE13937[, "ID_REF"] <- str_to_lower(GSE13937[, "ID_REF"])
GSE102286[, "ID_REF"] <- str_to_lower(GSE102286[, "ID_REF"])

find.1 <- GSE13937 %>%
  inner_join(miR.signature, by = c("ID_REF"="key"))
find.2 <- GSE102286 %>%
  inner_join(miR.signature, by = c("ID_REF"="key"))

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

EveIOU

2020-4-15 22:46:35

drunkfish69 发表于 2020-4-15 21:41
key

多谢朋友指点，按照您的代码（只是把ID_REF改成了X.ID_REF.，因为数据集列名就是这个）运行了一下，貌似不成功。此外，hsa-mir-3607与hsa-miR-3607，在专业上确实代表两种东西，前者是miRNA前体，后者是miRNA成熟体，两者能匹配上一个或两个都可以。再次感谢！
结果如下：

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

drunkfish69

2020-4-16 07:06:22

复制代码

我也有点糊涂了，设想find.2可以发现'hsa-miR-605', 'hsa-miR‐629'两条记录，实际只能发现一条。怀疑是不是TXT里的encode的问题？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

EveIOU

2020-4-16 12:31:00

drunkfish69 发表于 2020-4-16 07:06
我也有点糊涂了，设想find.2可以发现'hsa-miR-605', 'hsa-miR‐629'两条记录，实际只能发现一条。怀疑 ...

还是感谢您的热心帮助。多谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

drunkfish69

2020-4-17 05:43:14

复制代码

我的怀疑没错，是编码的问题，用view(GSE102286)，找到‘hsa-miR-629'，把它copy/paste到key里面就出来了。说明值和原来手工输入的不同。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

EveIOU

2020-4-17 12:28:35

drunkfish69 发表于 2020-4-17 05:43
我的怀疑没错，是编码的问题，用view(GSE102286)，找到‘hsa-miR-629'，把它copy/paste到key里面就出来了 ...

多谢朋友。
我本来有个设想：有时候，我想用hsa-miR-629匹配hsa-miR-629-5p, hsa-miR-629-3p（这里只是举例而已，hsa-miR-629后面并没有其他字符了），这种情况下用找交集的思路是不是实现不了啊？我用grep函数，hsa-miR-629后面加上通配符“.* ”（代表0或多个任意字符），是不是更容易实现我的要求呢？您是否还有更好的建议？多谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

drunkfish69

2020-4-17 13:12:39

EveIOU 发表于 2020-4-17 12:28
多谢朋友。
我本来有个设想：有时候，我想用hsa-miR-629匹配hsa-miR-629-5p, hsa-miR-629-3p（这里只是举 ...

我纠结的是你数据源里的编码是什么？为什么同样的字符和R里面手工收入不能匹配？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

drunkfish69

2020-4-17 14:10:13

EveIOU 发表于 2020-4-17 12:28
多谢朋友。
我本来有个设想：有时候，我想用hsa-miR-629匹配hsa-miR-629-5p, hsa-miR-629-3p（这里只是举 ...

这个可以考虑截取前11个字符，然后与搜索键入的关键字进行左链接。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

drunkfish69

2020-4-17 16:25:46

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

EveIOU

2020-4-17 21:36:28

drunkfish69 发表于 2020-4-17 16:25

多谢，数据是从GEO数据库下载的，具体他用的什么编码超出我的理解力了。综合考虑您关于编码的判断（复制数据集中"hsa-miR-629"），还有llb_321坛友去掉引号的建议（grep('miR.pattern[k]', ...)的引号），修改我原来的代码，得到下图这样的结果（初始预期）

关于您建议的将数据集中的字符串截取11个字符，进行左连接，不知能否实现我以下目的呢？我目前了解substring可以截取字符串，如果数据集比较多，会不会比较麻烦？
我的新设想是：在我原代码基础上，或者您的代码，加个循环，得到如下结果（手写的），了解具体哪个miR，出现在某个数据集中，还有行数（这个目的是主要的，形式是次要的）（grep函数，value = T参数给出了名称，去掉value = T参数，就会给出位置：行数）。前面也和您说过，hsa-miR-629和hsa-mir-629（举例，r大写与小写），代表两种不同的东西。grep函数中ignore.case = T参数表示忽略大小写，正好符合我的大小写都匹配的要求。换言之，不管大小写，我都想要。麻烦您再给看一下，多谢！！
[1]GSE13937
character(0)
character(0)
character(0)
character(0)
character(0)
character(0)                      以上6行有没有无所谓，反正是代表没匹配上就行

[2]GSE102286
character(0)
character(0)
character(0)
character(0)                      以上4行有没有无所谓，反正是代表没匹配上就行
[1] "\"hsa-miR-605\""       581  （代表在数据集中的行数）
[1] "\"hsa-miR-629\""       604

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

EveIOU

2020-4-17 21:42:20

drunkfish69 发表于 2020-4-17 16:25

还有，您提到的 #读取文件这一段可以改下放入下面的循环体内，文件名GSE组合，留给你自己玩吧
我不会啊，怎么放到循环体里，请指点。我前面一直不太懂循环，前几天在网上学习了一下，初步懂了一点点。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

15楼

drunkfish69

2020-4-17 23:00:30

EveIOU 发表于 2020-4-17 21:42
还有，您提到的 #读取文件这一段可以改下放入下面的循环体内，文件名GSE组合，留给你自己玩吧
我不会 ...
复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

R语言论坛

管理科学与工程

学术道德监督

经管文库（原现金交易版）

宏观经济学

世界经济与国际贸易

热门文章

精准匹配，菁英相伴--经管之家单身俱乐部， ...

科研时间70%耗在“下载-复制-粘贴”？零代码 ...

我该如何记住你？智能体记忆系统的演化之路

CDA数据分析脱产就业班于2026年3月7日开班！ ...

CDA 认证考试大纲 2025 重磅更新：一二级考 ...

表格结构数据的核心特征及具象实例解析

伍德里奇计量经济学导论第六版教材PDF

2026年Agent领域十大趋势判断

湖南统计年鉴2025（Excel版）

中外历史年代对照表

推荐文章

2026JG学术冬训营:从Stata初高到Python机器 ...

【必看】【本版版规，欢迎发悬赏贴求助】

26年寒假天津站｜Gemini论文写作&数据分析 ...

关于如何利用文献的若干建议

关于学术研究和论文发表的一些建议

关于科研中如何学习基础知识的一些建议 (一 ...

一个自编的经济学建模小案例 --写给授课本科 ...

AI智能体赋能教学改革: 全国AI教育教学应用 ...

2025中国AIoT产业全景图谱报告-406页

关于文献求助的一些建议

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群