全部版块 我的主页
论坛 数据科学与人工智能 大数据分析 Hadoop论坛
23414 113
2015-02-25
      据中国之声《央广新闻》报道,春节期间,全国最火的菜肴是什么?哪家餐厅最火爆?各地市民最喜欢去哪里逛街购物?80后、90后、00后,不同年龄段的人挑选的年货差别又有多大?“大数据”时代,当你轻点鼠标的同时,你的购物数据也进入后台,成为统计的依据。而这些数据背后,国人消费观正在发生哪些改变呢?


       相信你看过一些大数据相关书籍,原理知识都能理解,可是怎么应用于工作中呢?大数据分析环境怎么搭建?如果进行大数据分析?其实只要有人手把手传授你,CDA大数据周末班带你跨入大数据分析门槛,其实没你想象那么难。

附件一.jpg

     而Hadoop大数据分析课程给你的就是 把握时代脉博,掌握大数据时代前沿。

     能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。


     Hadoop+Hive+Mahout+Spark,大数据分析利器全覆盖,CDA +Oracle双认证,offer任你挑!





《CDA-Hadoop大数据分析师》第十期

保证课程效果,现场限报20人,远程限报25人


| 课程介绍 |


     课程以大数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。

            


      Hadoop大数据分析课程给你的就是 把握时代脉博,掌握大数据时代前沿;全面掌握Hadoop的架构原理和使用场景;全面掌握Hadoop的三种架构方式及搭建过程;熟练掌握HDFS文件系统与MapReduce程序开发思想; 能利用hadoop平台进行大数据分析;能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。


| 北京/上海 现场&远程直播|


  

时间

课程

大纲简介

预期效果


3.25(京)

4.01(沪)

大数据前沿知识及hadoop入门

1.大数据前沿知识介绍

2.课程介绍

3. Linux及unbuntu系统基础

4.hadoop的单机和伪分布模式的安装配置

零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置

3.26(京)

4.02(沪)

Hadoop部署进阶

1.Hadoop集群模式搭建

2. Hadoop分布式文件系统HDFS深入剖析

3.使用hdfs提供的api进行hdfs文件操作

4. Mapreduce概念及思想

熟练掌握hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析

4.1-4.2(京)

4.8-4.9(沪)

大数据导入与存储、Hbase理论及实战        

1.mysql数据库基础知识

2.hive安装部署与案例

3.sqoop安装及使用

4. hbase简介、安装及配置

了解mysql等数据库管理系统的原理,能进行简单的SELECT语句设计,熟悉hive的架构及设计原理,能在hadoop集群上部署hive,并了解使用hive的基本语法规则,能将mysql中的数据,使用sqoop组件导入到hive中。

4.08(京)

4.15(沪)

Spark配置及使用场景

1. spark简介、安装及配置

2. scala简介、安装及语法讲解

掌握Spark、scala的安装、配置及使用场景

4.09(京)

4.16(沪)

spark大数据分析原理

1.Spark内核:基本定义、Spark任务调度

2.Spark Streaming 实时流计算

3.Spark MLlib 机器学习

4.Spark SQL

理解Spark运作机制,能够使用Spark解决数据挖掘工作

4.15-16(京)4.22-23(沪)

hadoop+Spark大数据分析

1.实战案例深入解析2.hadoop+Spark的大数据分析之分类

3.Logistic回归与主题推荐



掌握基于hadoop+Spark的大数据分析方法的使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析


| CDA_Hadoop大数据分析师@第十期 |

项目名称

CDA_Hadoop大数据分析师(8天周末班)

时间

北京:3月25日——4月16日 上海:4月1日——4月23日

地点

上海市黄浦区人民广场&北京市海淀区丹龙大厦

价格(元)

全程:8800(现场班)/5800(远程直播)


优惠


1. 全日制在读学生8折优惠(仅限全日制本科生及硕士研究生)

2.  提前一月报名并缴费立减500元

3.  参加过论坛其他现场班老学员9折优惠

4.   同一单位三人报名9折优惠,五人及以上8折优惠
注明:以上优惠不能累加 》》》》

证书(自愿申请)

1.可申请工信部《数据分析师》证书
2.完成课时学习后即可申请甲骨文大数据认证 证书
3.CDA大数据分析师证书每年6月和12月考试,通过者即可获得

最新福利


全套现场视频资料,反复学习,在线答疑

赠送《数据分析统计基础》视频一套

赠送《Java编程基础知识》视频一套

可2000元购买CDA level1级全套视频资料(原价2700元)

咖啡茶歇常备,论坛币1000个/人


大数据试听视频http://www.peixun.net/view/826.html


大数据环境配置干货:http://www.tudou.com/programs/view/CS3KvXCXRik/


| 学员对象 |


1.   大数据分析,数据挖掘兴趣爱好者及转行人士

2.   职位晋升、薪酬提高人士

3.   在校数学,经济,计算机,统计等专业教师和学生

4.   各大数据项目负责人及其团队人士

| 报名流程 |


       1.在线填写报名信息

       2.给予反馈,确认报名信息

       3.网上缴费

       4.开课前一周发送电子版课件和教室路线图


(上海现场报名)

  (远程直播报名)

(北京现场报名)


  CDA 大数据分析交流QQ群 368178559

| 师资团队 |



       谢邦昌;台湾大学生物统计学博士,台湾著名大学天主教辅仁大学统计信息学系教授。现任中华数据挖掘协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。中国人民大学统计学系Data Mining中心客座教授,上海财经大学统计学系客座教授。厦门大学计划统计学系客座教授。西南财经大学客座教授。他是数据挖掘界领军人物及世界知名统计学家。发表过近三百篇关于统计和数据挖掘的论文。出版了近五十余本相关专著。拥有大数据分析多年行业经验。


         曹正凤;北京大数据协会理事,首发集团智慧交通大数据中心筹备组负责人,经管之家(原人大经济论坛)大数据培训中心负责人,统计学专业博士,具有多年的JAVA程序设计和统计教学经验,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文,且发表的EI核心收录论文受到多次检索。目前致力于大数据分析前沿领域研究,主持经管之家大数据项目《基于hadoop架构的论坛主题推荐系统》,主持全国统计科学研究项目《基于大数据平台的我国宏观经济走势预测》,研究参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目。


       辛立伟 ;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。目前专注于Java EE6、Java富互联网应用程序、Android 3G软件的研发、相关技术培训和企业咨询等。多次参与大数据分析课程教学。



       张田圆;软通动力信息技术(集团)有限公司助理副总裁、智慧业务事业群 CTO。分管技术领域:云计算、大数据、大规模并发系统、智慧城市及众创空间等。2008年主导设计海信集团IPTV互动电视系统及智能电视系统的研发,采用大规模分布式系统的原理支撑一千多万台海信智能电视终端。2010年和中科曙光合作,建设无锡市城市云数据中心,负责云存储中心的建设和云存储产品的研发,实现大规模数据和存储、处理及在线迁移、分级存储等,为城市云计算中心提供云存储基础服务。2012年主导实施甘肃省政府建设西北政企云、陕西北斗云、山东省齐鲁兴业云,和北京市计算中心、天津超算中心、河南工业云、山东工业云等都有很好的合作。2014年至今主导实施山西省移动大数据平台、浙江省绍兴市智慧交通大数据平台和无锡城市大数据中心建设,并与北大合作建立大数据创新研究院。
  

      董轶群;计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方向为智能规划、空间推理、基于大数据的时空信息系统。多年来从事计算机相关领域的研究,曾参与多个国家自然科学基金面上项目、重大项目等纵向课题的研究工作,并在国内外权威期刊与重要会议上发表了多篇理论成果。


      王安;钱方银通科技有限公司,首席分析师。中国科学技术大学理论力学学士,中国科学院计算力学硕士,北京大学光华管理学院MBA。此前曾带领团队为多家大中型银行,保险公司提供风险管理,数据分析咨询服务,关注领域包括,定量化风险管理,互联网金融,大数据应用。


| 其他服务 |


       1.讲义、数据等全套资料

       2.赠送全套同步课程视频

       3.课前预习视频和资料

       4.助教全方位答疑服务

       5.赠送论坛币1000枚

       6.课程答疑

       7.线下交流活动

       8.咖啡茶歇,论坛币(1000个)

       关于重听:在参加本期之后的后续三期可以(并且只能)选择一期免费来听。


| 在线咨询 |



       工作时间:周一至周五 8:30-18:00 其他时间请致电手机。


       座机:010-68456523

       QQ:28819897122881989712

       手机:13718534278

       邮箱:zhangwei@pinggu.org







二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-2-25 08:47:28
详情课程内容:

(一)基础理论部分
1.数据分析基础
(1)数据分析过程概述
(2)概率论与数据统计
(3)抽样估计与假设检验
(4)方差分析与回归分析
(二)java基础
(1)JDK的安装配置,Java基本知识、数据类型以及基本语法
(2)Eclipse的编程入门
(3)面向对象的思想基本介绍,类、对象、接口、封装、继承
(4)Java的集合类——数组、Set、List、Map、Queue
(5)异常处理——Checked Exception、Unchecked Exception,如何通过异常信息捕获错误
(6)Java的垃圾回收机制以及多线程简介
(7)Java的文件操作、包的概念及如何打包
(8)数据库基础知识及SQL语法
(9)基于servlet技术的B/S应用开发及代码实现案例详解

(三)linux基础
(1)linux的介绍
(2)Linux入门:选择合适的Linux发行版、如何安装Linux
(3)linux操作系统命令及使用命令编辑文件
(4)Linux下SSH命令使用方法详解

(四)hadoop理论课程
1.hadoop安装配置及运行机制解析
本节是大数据分析的环境搭建课程,属于操作型课程,主要讲述如何在linux单机上面安装hadoop的伪分布模式,在linux集群上面安装hadoop集群。对于不熟悉linux的同学,课程中会简单的讲解常用的linux命令。这两种是必须要掌握的。通过讲师手把手、面对面的交流,教会学员自己搭建一个真实的hadoop环境,在此环境下运行hadoop自带的小程序。主要内容包括:
(1)从google的三篇大数据论文说起
(2)Hadoop 概念、版本、历史
(3)Hadoop 伪分布及集群的详细安装步骤
(4)三个hadoop自带的小例子带你进入hadoop的世界
(5)使用如何通过命令行和浏览器观察hadoop的运行过程
(6)介绍hadoop的安全模式
(7)如何查看日志信息

Hadoop分布式文件系统深入剖析
本节将对hadoop架构的分布式文件系统HADFS进行深入的分析,hdfs是所有hadoop系统的基础,它是hadoop的核心内容之一。主要的内容包括:
(1)深度分析google的Google GFS 文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。
(2)HDFS的概念及设计
(3)Hdfs体系结构及运行机制详述
(4)NameNode、DataNode、SecondaryNameNode的作用及运行机制
(5)block 的划分原理、存储方式和配置文件
(6)hdfs的备份机制和文件管理机制
(7)HDFS文件系统的常用命令
(8)使用命令及JAVA语句操作hdfs中的文件
(9)rpc机制简介及HADFS中的rpc通信

MapReduce理论及实战
(1)深度分析google的MapReduce编程模型
(2)hadoop中的MapReduce工作原理
(3)通过演示单词计数程序,详细讲述mapreduce运行过程中类的调用过程
(4)详细讲述如何覆盖 Mapper 功能、如何覆盖 Reducer 功能。
(5)MapReduce job的生命周期中job提交、task分发和task执行
(6)MapReduce中block 的调度及作业分配机制
(7)讲解hadoop的计数器、排序、分组等算法
(8)通过一个小的应用,详细介绍如何在eclipse中编写MapReduce程序,打包成可在hadoop上运行的jar,并在集群上运行
(9)详细讲解运行结果的分析

hadoop生态环境介绍
(1)Hbase简介,包括HBase的基础概念 、数据模型、存储模型及hbase的伪分布和集群的安装
(2)ZooKeeper简介,包括ZooKeeper的安装、运行及示例
(3)Pig简介,包括Pig的安装、运行及示例
(4)Hive简介,包括Hive的安装、运行及示例
(5)sqoop简介,包括Sqoop介绍、命令、原理及流程
(6)nosql简介,包括nosql的概念、种类及发展趋势

(三)大数据分析思想、工具及实战案例
1.大数据分析思想介绍
(1)大数据分析的前世今生
(2)几种典型的大数据架构分析
(3)大数据分析过程描述
(4)大数据时代的数据分析思想的变革

2.Mahout,大数据分析的急先锋
Mahout 是 Apache SoftwareFoundation(ASF)旗下的一个开源项目,它通过和hadoop配合,实现在推荐、分类等领域中的大数据分析。
(1)Mahout的下载、安装与部署
(2)UCI经典数据集介绍
(3)使用经典数据集测试和运行Mahout实现的算法
(4)主要算法包括:kmeans算法、canopy算法、dirichlet 算法和meanshift算法

3.RHadoop,R语言从小数据分析到大数据分析的化丽转身
(1)R语言简介
(2)安装并运行RHadoop
(3)RHadoop的逻辑结构
(4)Rhadoop实战案例—word cout
(5)与hadoop word count 函数比较分析

三个真实的大数据分析案例
(1)人大经济论坛日志分析,介绍日志分析的相关知识,以及人大经济论坛现在的日志管理现状,设计并实现适合人大经济论坛的基于hadoop架构的大数据日志分析系统,手动编写日志分析MapReduce程序,并在集群环境下运行自已的jar文件,实现从零起步到hadoop架构,直到实际的大数据分析真实案例的飞跃。
(2)基于旅游点评网站的文本挖掘,介绍文本挖掘的相关知识,使用网页爬虫抓取旅游点评网站的实际数据,实现数据的清洗和预处理,制定定时更新机制,并尝试使用手动编程实现MapReduce程序,在hdfs上运行和处理采集的数据,真正参与基于实际项目的大数据分析过程。
(4)基于Mahout的人大经济论坛主题推荐,介绍推荐系统和汉字主题推荐涉及的文本挖掘等相关知识,以及人大经济论坛主题推荐的项目背景,项目的需求分析以及基于hadoop+Mahout算法模型和系统架构设计解析,并同时使用手动编写MapReduce代码和利用Mahout提供的主题推荐算法两种方法解决人大经济论坛的主题推荐。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-25 08:52:28
support
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-25 08:53:32
Hadoop大数据分析值得期待,引领潮流!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-25 08:56:03
大数据时代在国内会越来越成熟,赶紧关注!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-25 09:01:09
Hadoop大数据分析,新年好课程!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群