导语:或许是网上嘈嘈杂杂的关于大数据、互联网的新形势争论,或许是招聘网站上越来越多的技能需求,让我在某一天突然想学点Python,是的需要学点Python了,虽然我现在不知道它能干什么。
【第一天】谁来给我讲讲Python?
我是一名数据分析师,曾在漫长的岁月中使用SAS、Matlab和R(使用频率依次递减)。其他如SPSS、STATA、Eviews也都是必备的基本技能。或许是网上嘈嘈杂杂的关于大数据、互联网的新形势争论,或许是招聘网站上越来越多的技能需求,让我在某一天突然想学点Python,是的需要学点Python了,虽然我现在不知道它能干什么。
“谁来给我讲讲Python?”
作为无基础的初学者,只想先大概了解一下Python,随便编个小程序,并能看懂一般的程序,那些什么JAVA啊、C啊、继承啊、异常啊通通不懂,于是我找了很多资料,并过滤掉了对我这个阶段而言的无用信息,写成下面这篇日记,以完全初学者的角度入手,里面有我学习过程中提出的一些疑问,和我找到答案,简单、清晰。
今天的学习大纲如下:
一、为什么学Python?
二、安装与熟悉
1、安装
2、熟悉
三、容器
1、什么是容器
2、序列的一些通用操作
3、列表操作
4、字符串操作
5、字典操作
日记小结
一、为什么学Python?在搜索Python相关用处的时候,看到一些帖子讨论,坚定了我学习Python的决定:
知乎网友张博:
“楼主不知道知乎就是用Python做支撑的么?”
知乎网友吴畅:
“Python会提高程序员的审美标准。”
外刊IT评论:
“跟C/C++/Java相比 — Python/Ruby能让你用少的多的多的代码写出相同的程序。”
人大经济论坛网友“zxn2011”:
“在纽约做了一年多的数据的dataanalyst,基本上已经抛弃MATLAB,95%的工作都是用python和R和sas完成。”
“你学matlab不是也要学编程吗?既然都是编程,为什么不学一个彻底的编程语言呢。而且今后和CTP等交易平台对接的话,matlab就无能为力了,到时候再学python岂不是晚了。”
(注:据笔者后来了解,matlab似乎也是可以与CTP平台对接的。)
Bruce Eckel:Life is short, you need Python. 人生苦短,我用Python。
…...
还有很多,不管怎样,作为一名偏向经济、金融的统计分析人员,想与杀入自己领域的IT码农们争一方天下,Python是个捷径。因此,今天,我开始学习Python!
二、安装与熟悉1. 安装去这里下载Python并安装https://www.python.org/download/,我装了2.7.7,并去这里下载一些扩展模块http://www.lfd.uci.edu/~gohlke/pythonlibs,各种模块,无论是32位还是64位,应有尽有。这里先下载Numpy,对应我电脑32位的,版本2.7的,如果不知道自己电脑室32位还是64位,那就都下下来,到时候哪个安装成功,就说明适合那个。
下载安装之后,打开pythonshell,在这个界面就可以使用python了。
2. 熟悉在正式介绍python之前,了解下面两个基本操作对后面的学习是有好处的:
(1)基本的输入输出可以在Python中使用+、-、*、/直接进行四则运算。
————————————
>>>1+3*3
10
————————————
也可以用print语句来显示
————————————
>>>print1+3*3
10
————————————
输入字符,可以用双引号或者单引号:
————————————
>>>print"hello"
hello
>>>print'hello'
hello
————————————
在字符串的输入中,为了便于阅读,想要换行再输,可以使用反斜线:
————————————
>>>print "abc\
ABC"
abcABC
————————————
这个时候我有了一个疑问:
“如果不是为了易读,这个字符串本身就是要换行该怎么办?”
答案是使用三个双引号把内容给括住:
————————————
>>>print """abc
ABC"""
abc
ABC
————————————
(2)导入模块使用import可以导入模块,导入之后,就可以使用这个模块下面的函数了。
比如导入math模块,然后使用math模块下面的sqrt函数:
————————————
>>>importmath
>>>math.sqrt(9)
3.0
————————————
这时我有疑问了:
“每次引用函数的时候,math这个模块前缀都要带吗?可不可以不带?”
直接输入sqrt(9)是会报错的,好烦人,那么有什么办法可以不用每次都带前缀?办法是有的,用“from 模块 import 函数”的格式先把函数给“拿”出来。
————————————
>>>from math import sqrt
>>>sqrt(9)
3.0
————————————
这样每次使用sqrt函数的时候就不用再加math前缀了。当我正准备跳过的时候,又有了一个问题?
“math模块下面有那么多函数,可不可以写一个语句,然后math下面所有函数都可以直接使用?”
调用了math下面的sqrt函数,写一个from…import…,再调用下面的floor,还要写一个,如此也挺麻烦的,有个办法可以一下把所有函数都给“拿”出来:
——————————————
>>>from math import *
>>>sqrt(9)
3
>>>floor(32.9)
32.0
——————————————
当然,后来我了解到,应该尽量避免使用from…import…而使用import语句⊙﹏⊙,因为这样可以更加易读,也可以避免冲突。
三、容器
1、什么是容器开始学Python时,被它的数据结构,什么字典、序列、元组等等搞的很混乱,估计有跟我一样的初学者,所以我梳理了一下留存:
首先要从容器说起,Python中有一种名为容器的数据结构,顾名思义,容器,就是装数据的器具,它主要包括序列和词典,其中序列又主要包括列表、元组、字符串等(见下面那张图)。
列表的基本形式比如:[1,3,6,10]或者[‘yes’,’no’,’OK’]
元组的基本形式比如:(1,3,6,10)或者(‘yes’,’no’,’OK’)
字符串的基本形式比如:’hello’
以上几种属于序列,序列中的每一个元素都被分配一个序号——即元素的位置,也称为“索引”,第一个索引,即第一个元素的位置是0,第二个是1,依次类推。列表和元组的区别主要在于,列表可以修改,而元组不能(注意列表用中括号而元组用括号)。序列的这个特点,使得我们可以利用索引来访问序列中的某个或某几个元素,比如:
——————————————
>>>a=[1,3,6,10]
>>>a[2]
6
>>>b=(1,3,6,10)
>>>b[2]
6
>>>c=’hello’
>>>c[0:3]
‘hel’
——————————————
而与序列对应的“字典”则不一样,它是一个无序的容器,
它的基本形式比如:d={7:'seven',8:'eight',9:'nine'}
这是一个“键—值”映射的结构,因此字典不能通过索引来访问其中的元素,而要根据键来访问其中的元素:
——————————————
>>>d={7:'seven',8:'eight',9:'nine'}
>>>d[8]
'eight'
——————————————
2、序列的一些通用操作除了上面说到的索引,列表、元组、字符串等这些序列还有一些共同的操作。
(1)索引(补充上面)序列的最后一个元素的索引,也可以是-1,倒数第二个也可以用-2,依次类推:
——————————————
>>>a=[1,3,6,10]
>>>a[3]
10
>>>a[-1]
10
——————————————
(2)分片使用分片操作来访问一定范围内的元素,它的格式为:
a[开始索引:结束索引:步长]
那么访问的是,从开始索引号的那个元素,到结束索引号-1的那个元素,每间隔步长个元素访问一次,步长可以忽略,默认步长为1。
——————————————
>>>c=’hello’
>>>c[0:3]
‘hel’
>>>c[0:4:2]
‘hl’
——————————————
这个就好像把一个序列给分成几片几片的,所以叫做“分片”
(3)序列相加即两种序列合并在一起,
——————————————
>>>[1,2,3]+[4,5,6]
[1,2,3,4,5,6]
>>>‘hello,’+’world!’
‘hello,world!’
——————————————
两种相同类型的序列才能相加
(4)乘法即序列可以被重复n次
——————————————
>>>’hello’*5
‘hellohellohellohellohello’
——————————————
(5)成员资格为了检查一个值是否在序列中,可以用in运算符
——————————————
>>> 'o' in a
True
>>> 't' in a
False
——————————————
下面可以用这张表回忆一下几个操作分别是干嘛的: