怎样提取 "Gill, Mr. John William"中的“Mr” ，没有固定位置 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛

怎样提取 "Gill, Mr. John William"中的“Mr” ，没有固定位置

1566

3

收藏 2018-07-03

数据是

Sage, Miss. Dorothy Edith "Dolly"

Gill, Mr. John William

Bystrom, Mrs. (Karolina)

Duran y More, Miss. Asuncion

Roebling, Mr. Washington Augustus II

需要提取姓名中的每个title，即“Miss”“Mr”“Mrs”，但是字母的位置是不固定的。
有查到用正则表达式来查询位置的代码如下
full$Title <- gsub('(.*, )|(\\..*)', '', full$Name)
但是没有看懂其中的正则表达式，有大神可以解释一下么，谢谢。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2018-7-7 16:24:55

这个就是2部分来看

(.*, ) 这个就是匹配任意字符+,号
(\\..*) 这个就是匹配 .号+任意字符，因为.号是转义字符，所以需要\\.

这个实际作用是把任意，号之前和.号之后的字符替换成“”空。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2018-7-8 09:46:10

首先定义
pattern，有很多种办法，
然后提取需要的
比如

复制代码

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2018-7-8 14:04:04

q378648220 发表于 2018-7-7 16:24
这个就是2部分来看

(.*, ) 这个就是匹配任意字符+,号

谢谢大神，看懂了

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群