全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1182 2
2017-08-25
怎么短时间内高效踏实地学习 Python
03.png

一、开课时间

时间:
2017年11月27-12月15日(十五天)

二、课程定价

费用:600元 /天(赠送录制视频)

三、学习方式

1、上课方式:同步现场直播学习+录播学习+在线答疑 +1万次反复观看

2、课程时间:上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00

3、直播课程,开课即学

4、在线反复观看,1万次反复观看


四、报名福利(优惠)

1、现场班老学员可以享受9折优惠;

2、同一机构3人以上报名,9折优惠;

3、同一机构6人以上报名,8折优惠;

4、赠送Python课程视频;

5、专业老师在线答疑;

6、精致课程练习题供学员课后操作更易于学员理解与掌握所受知识,提高实战能力;

7、报名成功后发送老师课程讲义供学员提前预习;

8、提供就业培训、就业指导、就业面试题;

9、CDA数据分析研究院俱乐部。

10、赠送经管之家(原人大经济论坛)论坛币1000

(前三项优惠不叠加)


五、讲师介绍

CDA数据分析讲师王小川老师
       同济大学管理学博士,现就职于国内某大型券商研究所,从事量化投资相关工作,并承担了部分高校统计课程教学任务。长期研究机器学习在统计学中的应用,精通MATLAB、Python、SAS等统计软件,热衷数据分析和数据挖掘工作,有着扎实的理论基础和丰富的实战经验。神经网络、数据挖掘、统计分析应用领域专家,国内最大的MATLAB论坛管理员,在硕士与博士期间,参与发表了SCI论文6篇,核心期刊论文5篇,获得同济大学奖学金,著有《MATLAB神经网络30个案例分析》一书。

                                             

CDA数据分析讲师唐宇迪老师

      计算机博士,专注于机器学习与计算机视觉领域,深度学习领域一线实战专家。参与多个国家级计算机视觉项目,多年数据领域培训经验,丰富的教学讲解经验,出品多套机器学习与深度学习系列课程,课程生动形象, 风格通俗易懂。


CDA数据分析讲师曹正凤老师

       经管之家(原人大经济论坛)大数据培训中心负责人,统计学专业博士,北京大数据协会理事,首发集团智慧交通大数据中心筹备组负责人,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文。


六、课程简介

(1)Python是基于C的一种面向对象、解释型计算机程序设计语言。近几年来Python在数据分析领域逐渐占据了统治地位,成为了名副其实的Number one。Python基础主要是带大家了解Python的基础语言部分,熟悉基础的Python语法,python运算符与表达式,控制流语句,python函数,python模块,异常处理等。

(2)Pandas是08年开发的一个python库,近几年的更新逐渐成为数据分析举足轻重的模块,python数据清洗中,我们将着重讲解pandas在数据清洗的功能和作用。

(3)通过爬虫、可视化、机器学习、推荐系统和几个商业经典的案例来学习python强大的功能


七、课程大纲

第一章:Python基础

1、Python的安装以及环境配置

2、Python语言特点

3、Python的数据类型和变量

4、Python中的运算

5、Python的数据结构

6、Python的控制流语句

7、Python中的异常处理和调试

8、Python函数调用和定义以及函数的参数

9、Python的类和面向对象编程

10、Python的文件、模块操作


第二章:python数据清洗

第一节.Numpy基础

(1)Numpy的ndarray

(2)数组的索引和切片

(3)数组的运算

(4)常用的数组方法


第二节.Pandas基础应用

(1)Series数据结构

(2)DataFrame数据结构

(3)基本功能

(4)汇总和计算统计描述

(5)缺失值的处理


第三节.Pandas数据规整

(1)数据加载&输出

(2)数据集的合并

(3)数据集的重塑

(4)数据重构


第四节.Pandas分组运算

(1)GroupBy技术

(2)数据聚合

(3)分组级运算和转换

(4)透视表和交叉表


第三章:python爬虫

1、网络协议的简单介绍

2、网页数据结构介绍

3、使用BeautifulSoup4库解析网页

4、使用Selenium获取动态网页数据


第四章:python机器学习

1.文本挖掘原理和案例

2.预测分析核心算法

3.机器学习经典算法

4.Python概率统计

5.数据可视化

6.Python经典金融分析

7.Python量化投资

8.算法和模型的优化        

9.模型精度评估和提升        

10.特征选取的方法

11.最佳k-means分类数

12.交叉验证(CV)        

13.不平衡数据处理        

14.XGBoost        

15.贝叶斯分析

16.逼近和最优化        

17.概率图模型        

18.马尔科夫&蒙特卡罗

      

第五章:python推荐系统

第一节.基于内容的推荐(距离度量和相似度度量)

(1)欧几里得距离(Euclidean Distance)

(2)曼哈顿距离(Manhattan Distance)

(3)闵可夫斯基距离(Minkowski Distance)

(4)向量空间余弦相似度(Cosine Similarity)

(5)皮尔森相关系数(Pearson Correlation Coefficient)


第二节.关联规则

(1)Apriori算法

(2)FP-Growth算法


第三节.协同过滤

(1)基于用户的协同过滤(UserCF)

(2)基于物品的协同过滤(ItemCF)

(3)基于模型的协同过滤(ModelCF)


八、课程重点

1、编辑器和互交式命令行的概念, IDE(集成开发环境)的概念, 熟悉各个不同的开发环境.

2、Python的语言特点, 输入和输出,常见的基础的数据类型以及变量的概念

3、Python中的基础数据结构,控制流语句,Python中的函数,异常处理类和面对对象的概念,IO操作,Python中常用的内置函数和高级特性正则表达式,Python连接数据库


九、课程目标

1、Anaconda安装配置完毕,能够进行预习和复习的代码管理以及相关的操作

2、熟悉Python的语言特点(语句块, 输入输出), 尝试去理解编程的思想.

3、熟悉基本的数据类型, 以及各个数据类型的常用的方法.

4、理解变量的概念.

5、能够熟练使用Python的运算符, 知道运算的优先级, 能够注意到代码的规范性.

6、 熟练掌握四个基础的数据结构, 了解他们的特点, 并知道在哪些场景下去使用.

7、熟练掌握各个控制流语句, 了解各个语句的特点, 并清楚的知道面对问题怎么去选择使用哪个语句.

8、能够查找常见的代码报错问题所在, 并且可以进行修复(语法错误, 缩进不对, 冒号丢失等等).

9、熟悉Python中的函数, 理解形参和实参, 理解变量的命名空间.

10、能够知道异常的概念, 并知道如何处理程序中的异常.

11、了解面对对象的概念, 能够使用简单的类, 能够理解类相关的代码.

12、了解简单的IO操作, 并了解编码相关的常见错误.

13、熟悉Python中的常用内置函数和高级特性.

14、理解正则表达式,并能够掌握基本的用法.

15、能够使用Python对数据库进行操作, 熟悉增删改查.

16、能够解决一些较为复杂的编程的问题.

17、熟悉编程的解决问题的思路, 掌握遇到编程问题或者报错时的提问技巧, 并能够自行处理简单的程序错误.

18、理解数组的数据结构

19、掌握N维数组的索引和切片的方法

20、熟悉Series数据结构

21、熟悉DataFrame数据结构

22、掌握常见的各类数据加载方式

23、掌握常用的DataFrame的方法

24、能够使用Pandas进行汇总和计算统计描述等

25、能够处理各种形式的缺失值

26、熟悉不同数据集的合并重塑和重构

27、强化练习数据清洗分析的流程熟悉度

28、综合训练Pandas的使用能力

29、掌握基本的网络协议的概念

30、熟悉网页的数据结构

31、掌握BeautifulSoup4库常用的相关内容

32、熟练掌握如何在静态网页中定位抓取

33、掌握动态网页的数据获取

34、了解爬虫的整体架构

35、学会监控爬虫的运行

36、能够快速开发小型的爬虫

37、了解各种不同的相似度计算方式

38、掌握关联规则的应用

39、掌握协同过滤的概念

40、理解两种协同过滤的异同点和优劣

41、能够自己通过Python重现协同过滤算法


十、报名流程及咨询
1. 提交报名信息:http://www.peixun.net/view/1068.html
2. 给予反馈,确认报名信息
3. 交费
开户行:北京农商银行四季青支行万寿寺分理处
户名:北京国富如荷网络科技有限公司
卡号:0404 1001 0300 0003 092
支付宝:guofuruhe@126.com
户名:北京国富如荷网络科技有限公司
4. 邮递发票



咨询方式

龚加勇
电话:010-53605625
手机:17773656856

Q  Q: 1281241407

邮 箱:gongjiayong@pinggu.org






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-31 14:38:33
python读写二进制文件的方法
本文实例讲述了python读写二进制文件的方法。分享给大家供大家参考。具体如下:
初学python,现在要读一个二进制文件,查找doc只发现 file提供了一个read和write函数,而且读写的都是字符串,如果只是读写char等一个字节的还行,要想读写如int,double等多字节数 据就不方便了。在网上查到一篇贴子,使用struct模块里面的pack和unpack函数进行读写。下面就自己写代码验证一下。

接着再将其读进来   
>>> file = open(r"c:/debug.txt", "rb")
>>> (a,b,c) = unpack("idh",file.read(8+8+2))
>>> a,b,c
(12345, 67.890000000000001, 15)
>>> print a,b,c
12345 67.89 15
>>> file.close()

在操作过程中需要注意数据的size

注意  wb,rb中的b字,一定不可以少

方法1:   
myfile=open('c:\\t','rb')
s=myfile.read(1)
byte=ord(s) #将一个字节 读成一个数
print hex(byte) #转换成16进制的字符串

方法2   
import struct
myfile=open('c:\\t','rb').read(1)
print struct.unpack('c',myfile)
print struct.unpack('b',myfile)

写入

To open a file for binary writing is easy, it is the same way you do for reading, just change the mode into “wb”.
file = open("test.bin","wb")
But, how to write the binary byte into the file?
You may write it straight away with hex code like this:
file.write("\x5F\x9D\x3E") file.close()
Now, check it out with hexedit,
hexedit test.bin
You will see this:
00000000 5F 9D 3E _.> 00000020 00000040
Now, open the file to append more bytes:
file = open("test.bin","ab")
What if I want to store by bin value into a stream and write it one short?
s ="\x45\xF3" s = s + "%c%c" % (0x45,0xF3) file.write(s) file.close()
Any convenient ways if I can obtained a hex string, and want to convert it back to binary format?
Yes, you just need to import binascii
import binascii hs="5B7F888489FEDA" hb=binascii.a2b_hex(hs) file.write(hb) file.close()
希望本文所述对大家的Python程序设计有所帮助。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-31 14:40:09
Python正则表达式使用经典实例
本文给大家总结了17种python正则表达式使用经典实例,非常不错具有参考借鉴价值,下面列出Python正则表达式的几种匹配用法,具体内容如下所示:

1.测试正则表达式是否匹配字符串的全部或部分
regex=ur"" #正则表达式
if re.search(regex, subject):
do_something()
else:
do_anotherthing()

2.测试正则表达式是否匹配整个字符串   
regex=ur"\Z" #正则表达式末尾以\Z结束
if re.match(regex, subject):
    do_something()
else:
    do_anotherthing()

3.创建一个匹配对象,然后通过该对象获得匹配细节(Create an object with details about how the regex matches (part of) a string)   
regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
    # match start: match.start()
    # match end (exclusive): atch.end()
    # matched text: match.group()
    do_something()
else:
    do_anotherthing()

4.获取正则表达式所匹配的子串(Get the part of a string matched by the regex)   
regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
    result = match.group()
else:
    result = ""

5. 获取捕获组所匹配的子串(Get the part of a string matched by a capturing group)   
regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
    result = match.group(1)
else:
    result = ""

6. 获取有名组所匹配的子串(Get the part of a string matched by a named group)   
regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
result = match.group"groupname")
else:
result = ""

7. 将字符串中所有匹配的子串放入数组中(Get an array of all regex matches in a string)   
result = re.findall(regex, subject)

8.遍历所有匹配的子串(Iterate over all matches in a string)   
for match in re.finditer(r"<(.*?)\s*.*?/\1>", subject)
    # match start: match.start()
    # match end (exclusive): atch.end()
    # matched text: match.group()

9.通过正则表达式字符串创建一个正则表达式对象(Create an object to use the same regex for many operations)   
reobj = re.compile(regex)

10.用法1的正则表达式对象版本(use regex object for if/else branch whether (part of) a string can be matched)   
reobj = re.compile(regex)
if reobj.search(subject):
    do_something()
else:
    do_anotherthing()

11.用法2的正则表达式对象版本(use regex object for if/else branch whether a string can be matched entirely)
   
reobj = re.compile(r"\Z") #正则表达式末尾以\Z 结束
if reobj.match(subject):
    do_something()
else:
    do_anotherthing()

12.创建一个正则表达式对象,然后通过该对象获得匹配细节(Create an object with details about how the regex object matches (part of) a string)   
reobj = re.compile(regex)
match = reobj.search(subject)
if match:
    # match start: match.start()
    # match end (exclusive): atch.end()
    # matched text: match.group()
    do_something()
else:
    do_anotherthing()

13.用正则表达式对象获取匹配子串(Use regex object to get the part of a string matched by the regex)   
reobj = re.compile(regex)
match = reobj.search(subject)
if match:
    result = match.group()
else:
    result = ""

14.用正则表达式对象获取捕获组所匹配的子串(Use regex object to get the part of a string matched by a capturing group)   
reobj = re.compile(regex)
match = reobj.search(subject)
if match:
    result = match.group(1)
else:
    result = ""

15.用正则表达式对象获取有名组所匹配的子串(Use regex object to get the part of a string matched by a named group)   
reobj = re.compile(regex)
match = reobj.search(subject)
if match:
    result = match.group("groupname")
else:
    result = ""

16.用正则表达式对象获取所有匹配子串并放入数组(Use regex object to get an array of all regex matches in a string)   
reobj = re.compile(regex)
result = reobj.findall(subject)

17.通过正则表达式对象遍历所有匹配子串(Use regex object to iterate over all matches in a string)   
reobj = re.compile(regex)
for match in reobj.finditer(subject):
    # match start: match.start()
    # match end (exclusive): match.end()
    # matched text: match.group()

字符串替换

1.替换所有匹配的子串   
#用newstring替换subject中所有与正则表达式regex匹配的子串
result = re.sub(regex, newstring, subject)

2.替换所有匹配的子串(使用正则表达式对象)   
reobj = re.compile(regex)
result = reobj.sub(newstring, subject)

字符串拆分

1.字符串拆分   
result = re.split(regex, subject)

2.字符串拆分(使用正则表示式对象)   
reobj = re.compile(regex)
result = reobj.split(subject)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群