数据是
| Sage, Miss. Dorothy Edith "Dolly" |
| Gill, Mr. John William |
| Bystrom, Mrs. (Karolina) |
| Duran y More, Miss. Asuncion |
| Roebling, Mr. Washington Augustus II |
需要提取姓名中的每个title,即“Miss”“Mr”“Mrs”,但是字母的位置是不固定的。
有查到用正则表达式来查询位置的代码如下
full
$Title <-
gsub(
'(.*, )|(\\..*)',
'', full
$Name)
但是没有看懂其中的正则表达式,有大神可以解释一下么,谢谢。