全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
638 0
2022-03-04

【你将会学到】
1、大数据生态系统相关知识
2、Linux基础
3、Hadoop及其生态的安装配置
4、HDFS基础及核心原理
5、HDFS操作方法
6、Hadoop资源管理框架YARN
7、MapReduce基本原理
8、Python实现mapreduce分布式计算
9、Python操作HDFS
10、Sqoop基本介绍及安装方法
11、Sqoop导入数据方法和导出数据方法

【课程内容】
第一章  大数据基础
    1-1  大数据生态系统介绍、linux基础
    1-2  大数据生态系统介绍、linux基础
    1-3  大数据生态系统介绍、linux基础
    1-4  大数据生态系统介绍、linux基础
    1-5  大数据生态系统介绍、linux基础
    1-6  大数据生态系统介绍、linux基础
    2-1  Hadoop及其生态的安装配置
    2-2  Hadoop及其生态的安装配置
    2-3  Hadoop及其生态的安装配置
    2-4  Hadoop及其生态的安装配置
    2-5  Hadoop及其生态的安装配置
第二章  Hadoop基础
    1-1  HDFS基础及核心原理、HDFS操作方法
    1-2  HDFS基础及核心原理、HDFS操作方法
    1-3  HDFS基础及核心原理、HDFS操作方法
    1-4  HDFS基础及核心原理、HDFS操作方法
    1-5  HDFS基础及核心原理、HDFS操作方法
    2-1  Python实现mapreduce分布式计算、Python操作HDFS
    2-2  Python实现mapreduce分布式计算、Python操作HDFS
    2-3  Python实现mapreduce分布式计算、Python操作HDFS
    2-4  Python实现mapreduce分布式计算、Python操作HDFS
    2-5  Python实现mapreduce分布式计算、Python操作HDFS
    2-6  Python实现mapreduce分布式计算、Python操作HDFS
第三章  ETL工具Sqoop基本原理和常用指令
    1-1  Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
    1-2  Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
    1-3  Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
    1-4  Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
    1-5  Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
    1-6  Sqoop基本介绍及安装方法 、Sqoop导入数据方法和导出数据方法
第四章  脚本批量导入mysql以及Hive
    1-1  批量mysql数据导入,mysql导入hive, hive导入mysql
    1-2  批量mysql数据导入,mysql导入hive, hive导入mysql
    1-3  批量mysql数据导入,mysql导入hive, hive导入mysql
    1-4  批量mysql数据导入,mysql导入hive, hive导入mysql
    1-5  批量mysql数据导入,mysql导入hive, hive导入mysql

【授课形式】
线上录播

【课程说明】
Hadoop 是目前最主流的大数据处理框架之一,他是一个生态系统,包含很多组件,包括: HDFS(分布式文件系统),YARN(分布式资源调度系统),MapReduce(分布式计算系统)、Sqoop接口等。
当然突然接触到Hadoop,大家一定很困惑,Hadoop是什么?暂且不说抽象的概念,先说一些期实际应用:阿里巴巴采用了数十个Hadoop集群来处理从数据库中导出的商业数据;Ebay使用几十个节点组成的集群来存储数据,并长期使用Java编写的MapReduce应用,以及Pig、Hive、Hbase的组合应用以研究搜索优化;Facebook使用Hadoop来存储内部日志或结构化交易数据的源文件副本,将其作为机器学习、人工智能的数据源。说到这里,大家及时不知道Hadoop究竟是什么也想要去好好学习一下,并世界顶级公司都在使Hadoop生态系统。
实际上Hadoop不是一个单一的工具,而是一系列的分布式系统,我们可以运用其处理海量数据,而不用担心某一台服务器内存的限制。
CDA数据分析分布式集群架构与hadoop基础课程分为多个部分来讲解,首先需要强调的内容是Hadoop各个组件的认识、安装与简单运行。本部分内容以Hadoop发展为开端,并依次介绍Hadoop运行的Linux生态系统和CentOS操作系统的基础操作,并在此基础上引导学员逐步安装Habse、MapReduce、Sqoop、Hive等大数据组件从而搭建自己的大数据平台架构。

【要求】
有一个稳定的运行环境
有一定的逻辑思维
有一定的分析能力和的洞察力

【本课程包括】
6天的线上录播课程


进入课程:《大数据 分析与Hadoop基础》
DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群