全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2634 3
2018-05-31
各位大神,有这样的一个数据,其中a24这一列包含【孕XX周】这个字段,中间的数字可能是‘孕28周’,‘孕23周’等,中间的数字各不相等,但是我想把这些结构为【孕XX周】字段全部截取出来,形成一个【孕XX周】单独一列,这种怎么办呢,R语言中有没有类似的模糊截取的功能。求教了。
捕获111.PNG
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-5-31 21:07:33
回想之前你遇到的那个提取字符串“abcd”的问题,我们已经使用了stringr这个包当中的一个叫str_extract的函数了。
那碰到模糊提取文本的问题呢?很容易联想到使用正则表达式+函数的组合办法来实现,即:

str_extract_all() + 正则表达式



举个例子,如下代码:
复制代码



附件列表
stringr-str_extract.jpg

原图尺寸 6.94 KB

stringr-str_extract.jpg

stringr-str_extract_all.jpg

原图尺寸 16.5 KB

stringr-str_extract_all.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-6-3 20:36:43
ckevinit 发表于 2018-5-31 21:07
回想之前你遇到的那个提取字符串“abcd”的问题,我们已经使用了stringr这个包当中的一个叫str_extract的函 ...
非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-6-3 21:22:24
thanks, I've learned a new trick
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群