【你将会学到】
1、ETL工具Sqoop基本介绍
2、ETL工具Sqoop安装方法
3、ETL工具Sqoop导入数据方法
4、ETL工具Sqoop导出数据方法
【课程内容】
Sqoop基本介绍、Sqoop安装方法、Sqoop导入数据方法、Sqoop导出数据方法
【授课形式】
线上录播
【课程说明】
当我们知道有Hadoop生态系统集成HDFS分布式存储数据、YARN分配资源、MapReduce管理任务之后,我们还需要知道的是:海量数据如何导入到HDFS中去?Sqoop 工具是Hadoop环境下连接关系数据库和Hadoop存储系统的桥梁,支持多种关系数据源(Mysql、Orale等)和非常关系数据库(HIVE、HDFS、hbase等)的相互导入。一般情况下,关系数据表存在于线上环境的备份环境,需要每天进行数据导入,但Sqoop则可以根据实际业务情况和每天的数据量考虑是否需要全表导入。例如:对于每天产生的数据量不是很大的情形可以全表导入,反之则进行部分导入。通过本阶段的学习,学员将能够掌握数据在传统数据库与大数据平台之间的相互传递。
【要求】
有一个稳定的运行环境
有一定的逻辑思维
有一定的分析能力和的洞察力
【本课程包括】
50分钟左右的线上录播课程