在数据处理过程中经常会遇到文本中含有空格,当我们进行merge匹配时,总是匹配失败,这时该怎么办?很多人想到的方案应该都是用subinstr将空格替换掉,但有时候你会发现subinstr可能会失效,比如下面这个例子(今天刚有人问我的)
一眼望去似乎没什么问题,但仔细看一下,你会发现公司名称最后一位多了个空格。这时候如果我们采用subinstr来替换空格,你会发现,根本不起作用,不信你可以试试。
此时,我想到这可能不是一般意义上的空格,我猜测可能是全角空格、制表符或其他杂七杂八的空格。这个时候,正则表达式就有用武之地了,我们可以用“\s”来干掉这些莫名其妙的空格,我也不用知道你究竟是什么类型空格,全部给你干掉。
Wow,此时可以看到所有的顽固空白都被轻松消灭了。
结语:今后只要遇到去掉空格问题,我们都可以统一采用这种方法,不必再用subinstr了,因为有时候会失效,而上述方法针对一切顽固空格全消灭。