序列中的字符串处理 - python论坛 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › python论坛

序列中的字符串处理

849

1

收藏 2017-03-14

大多数序列中的元素都可以被数值表示，这意味着它们都能被转换成为数组，如下所示：

复制代码

array([ 4, 6, 10, 14, 22, 26])
而在实际的数据分析项目中，我们也常常能够遇见由字符串构成的序列，如人名、地名等等，下面将分享一些处理字符串序列的基本方法，以及一些简单的数据读写方法。首先，大小写的处理是我们处理字符串时常见的问题，Python 内置的函数 capitalize 能够帮助我们将各种形式的字符串转化为首字母大写的形式：

复制代码

['Peter', 'Paul', 'Mary', 'Guido']
需要注意的是，这个函数无法处理缺失值，所以在转换大小写形式前，请确认你的目标字符串列表里没有缺失值：

复制代码

接下来，我们来看一下如何处理含有字符串元素的 Pandas 序列，首先我们构建一个 Pandas 序列 name：

复制代码

可以看到，我们的序列 name 中存在一个缺失值 None，我们可以通过 Pandas 序列的 str 属性将序列中的字符串元素提取出来，并调用 capitalized 函数，从而将所有字符串都转化为首字母大写的形式：

复制代码

类似地，我们还可以运用函数 lower 将所有的字符串转化为小写形式：

复制代码

复制代码

查看字符串长度：

复制代码

检查字符串首字母是否为 T：

复制代码

以上内容转自数析学院，原文后续还有字符串分割、正则表达式匹配等较为复杂的内容，有需要的同学可以直接访问原文查看

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2017-3-15 11:06:23

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群