一、课程背景
在数据分析的过程中,不论是什么样的数据,数据清洗绝对是绕不开的步骤,因为我们在进行数据分析的前提是获取的真实的数据,而真实的数据与在学习数据分析过程中拿到的干净的数据不同,真实的数据永远都不会是规整的,需要我们在重新进行整理,而这个过程也就被称为了数据清洗,将杂乱无章的数据清洗为规整的数据。
使用Numpy和Pandas进行数据清洗对于使用Python做数据分析来说是事半功倍的作用。如果你对Numpy和Pandas库完全不熟悉或者不是特别的熟悉,可以学习一下本课程,让你更熟悉的理解可以进行数据清洗的Numpy和Pandas库、并最使用Python中的Matplotlib进行数据可视化,将你在清洗过程中的数据更加清晰的展现出来。
二、学习目标
1、了解Numpy和Pandas的基础概念
2、了解Numpy中的元素操作与Ndarray对象
3、了解Pandas中的数据结构
4、了解Pandas中的DataFrame的常用操作。
5、了解Python中使用matplotlib进行数据可视化
三、课程对象
数据分析分析师、Python学习者、机器学习算法工程师
四、课程时间
1-2天(10小时)
五、授课形式
在线视频
六、课程纲要
第一章 Numpy的元素操作:创建数组、数组的属性、数组的转换、数组的广播功能
第二章 Numpy中的Ndarray对象:数组的索引与切片、数组的算术运算、数组的函数、数组的排序索引、数组的唯一化与集合逻辑
第三章 Pandas的基本数据结构:创建Series、创建DataFrame、Pandas的索引
第四章 Pandas中DataFrame的常用操作:DataFrame的查看与描述、缺失值的处理、数据的合并、分组运算、数据透视表功能、数据读入和导出
第五章 Python Matplotlib数据可视化:Matplotlib数据可视化基础知识、绘制散点图、折线图、条形图、饼图、箱线图
进入课程:
《Python数据清洗可视化入门》
DA内容精选