【你将会学到】
1、大数据生态系统相关知识
2、Linux基础
3、Hadoop及其生态的安装配置
4、HDFS基础及核心原理
5、HDFS操作方法
6、Hadoop资源管理框架YARN
7、MapReduce基本原理
8、Python实现mapreduce分布式计算
9、Python操作HDFS
10、Sqoop基本介绍及安装方法
11、Sqoop导入数据方法和导出数据方法
【课程内容】
第一章 大数据基础
1-1 大数据生态系统介绍、linux基础
1-2 大数据生态系统介绍、linux基础
1-3 大数据生态系统介绍、linux基础
1-4 大数据生态系统介绍、linux基础
1-5 大数据生态系统介绍、linux基础
1-6 大数据生态系统介绍、linux基础
2-1 Hadoop及其生态的安装配置
2-2 Hadoop及其生态的安装配置
2-3 Hadoop及其生态的安装配置
2-4 Hadoop及其生态的安装配置
2-5 Hadoop及其生态的安装配置
第二章 Hadoop基础
1-1 HDFS基础及核心原理、HDFS操作方法
1-2 HDFS基础及核心原理、HDFS操作方法
1-3 HDFS基础及核心原理、HDFS操作方法
1-4 HDFS基础及核心原理、HDFS操作方法
1-5 HDFS基础及核心原理、HDFS操作方法
2-1 Python实现mapreduce分布式计算、Python操作HDFS
2-2 Python实现mapreduce分布式计算、Python操作HDFS
2-3 Python实现mapreduce分布式计算、Python操作HDFS
2-4 Python实现mapreduce分布式计算、Python操作HDFS
2-5 Python实现mapreduce分布式计算、Python操作HDFS
2-6 Python实现mapreduce分布式计算、Python操作HDFS
第三章 ETL工具Sqoop基本原理和常用指令
1-1 Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
1-2 Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
1-3 Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
1-4 Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
1-5 Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
1-6 Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
第四章 脚本批量导入mysql以及Hive
1-1 批量mysql数据导入,mysql导入hive, hive导入mysql
1-2 批量mysql数据导入,mysql导入hive, hive导入mysql
1-3 批量mysql数据导入,mysql导入hive, hive导入mysql
1-4 批量mysql数据导入,mysql导入hive, hive导入mysql
1-5 批量mysql数据导入,mysql导入hive, hive导入mysql
【授课形式】
线上录播
【课程说明】
Hadoop 是目前最主流的大数据处理框架之一,他是一个生态系统,包含很多组件,包括: HDFS(分布式文件系统),YARN(分布式资源调度系统),MapReduce(分布式计算系统)、Sqoop接口等。
当然突然接触到Hadoop,大家一定很困惑,Hadoop是什么?暂且不说抽象的概念,先说一些期实际应用:阿里巴巴采用了数十个Hadoop集群来处理从数据库中导出的商业数据;Ebay使用几十个节点组成的集群来存储数据,并长期使用Java编写的MapReduce应用,以及Pig、Hive、Hbase的组合应用以研究搜索优化;Facebook使用Hadoop来存储内部日志或结构化交易数据的源文件副本,将其作为机器学习、人工智能的数据源。说到这里,大家及时不知道Hadoop究竟是什么也想要去好好学习一下,并世界顶级公司都在使Hadoop生态系统。
实际上Hadoop不是一个单一的工具,而是一系列的分布式系统,我们可以运用其处理海量数据,而不用担心某一台服务器内存的限制。
CDA数据分析分布式集群架构与hadoop基础课程分为多个部分来讲解,首先需要强调的内容是Hadoop各个组件的认识、安装与简单运行。本部分内容以Hadoop发展为开端,并依次介绍Hadoop运行的Linux生态系统和CentOS操作系统的基础操作,并在此基础上引导学员逐步安装Habse、MapReduce、Sqoop、Hive等大数据组件从而搭建自己的大数据平台架构。
【要求】
有一个稳定的运行环境
有一定的逻辑思维
有一定的分析能力和的洞察力
【本课程包括】
6天的线上录播课程
进入课程:
《大数据 分析与Hadoop基础》
DA内容精选