全部版块 我的主页
论坛 数据科学与人工智能 大数据分析 Hadoop论坛
5599 17
2016-12-05

| 直播简介

大数据时代,企业面临着数据爆炸式增长且多样性裂变的新常态,数据在企业和整个商业世界中发挥的作用和产生的能量都发生了质的变化。与此同时,互联网数据化运营中的用户行为路径分析与网站的海量Web日志分析成了大多数公司遇到的难题!本次经管之家旗下CDA数据分析研究院邀请到了李亮、辛立伟两位嘉宾就以上问题,以“大数据引领未来、让企业的数据价值最大化”为主题进行交流,诚邀广大大数据分析爱好者、企业从事大数据相关岗位的朋友、以及想要学习大数据的朋友们参与本次的交流分享与探讨。

大数据公开课.jpg


| 直播时间

2016.12.7(周三)晚19:30-21:00    主题:基于Spark的用户行为路径分析的产品化实践

2016.12.10(周六)晚19:30-21:00  主题:Hadoop进阶之网站海量日志KPI指标分析


| 嘉宾简介

李亮,系统架构师&诸葛io创新产品部

前Intel 移动事业部算法成员,在Intel期间,获得4项专利授权。5年机器学习和数据挖掘经验。现关注点为大规模机器学习算法,流式机器学习算法,场景化数据分析。


辛立伟,Java高级软件工程师&CDA大数据工程师

Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。


| 分享主题

主题1:基于Spark的用户行为路径分析的产品化实践——用户行为路径–技术&详解

在互联网数据化运营实践中,有一类数据分析应用是互联网行业所独有的,那就是用户行为路径分析的应用。路径分析是指:对用户的每一次网络行为进行精细跟踪和记录,及在此基础上通过分析、挖掘得到用户的详细网络行为路径特点。这种分析,可以让企业有的放矢地进行产品的优化升级,并针对典型场景的用户转化数据来进一步制定和实施有针对性的策略,以期提升转化效率。这次的分享,我将结合在诸葛io的实际工作,分享这方面的实践经验。


内容提纲

•      程序员眼中的用户行为路径数据

1.     用户行为路径算法

2.     基于Spark的用户行为路径

3.     用户行为路径产品化实践

•      分析师眼中的用户行为路径数据

1.     什么是用户行为路径

2.     用户行为路径应用场景和商业价值

3.     诸葛用户行为路径自动化报告实践


主题2:Hadoop进阶之网站海量日志KPI指标分析

Web服务器产生的日志包含着网站最重要的信息,通过对日志进行分析可以了解网站的访问量、网页访问人数、以及哪个网页最有价值等信息。一般大型或超大型的网站,可能每小时就会产生10G的数据量。对于大规模的日志数据,结合Hadoop进行日志分析,是最适合不过的了。本次分享将着重分析pv、独立ip数和跳出率等指标,从数据收集、MapReduce的清洗与转换、利用Hive进行统计分析,使用sqoop将hive统计结果导入到关系型数据库中,最后以可视化效果展现,全方位为大家阐述如何用进行海量Web日志分析提取KPI数据。


| 内容提纲

• 分析Web服务器产生的日志,分析pv、独立ip数和跳出率等指标。

1. 使用flume这个分布式日志收集系统收集web服务器产生的日志,并上传到HDFS

2. 使用MapReduce大数据运算框架进行数据清洗和转换

3. 使用Hive对清洗后的数据进行统计分析

4. 使用sqoop将hive统计结果导入到关系型数据库中

5. 使用数据可视化技术展现分析结果


| 报名方式:

1.报名链接:http://aihome2016.mikecrm.com/hXPxUJ

在上面链接中提交后以上信息会自动跳转到公开课直播QQ群,管理员审核后将会通过,请您耐等待!

时机难得,不容错过!快来报名吧!直播期间参与提问还有机会获得精美礼品哦!快速报名吧!


2.资料获取:公开课录播视频及PDF讲义等资料请在关注公众号后在后台回复“127公开课”或“1210公开课”

qrcode_for_gh_2071c6b655f0_430.jpg


======================================

|相关课程推荐:


1.《CDA—Hadoop & spark大数据分析周末班第9期》(12.17北京/12.24上海)

课程以周末8天的集训展开,是CDA关于大数据分析方面研发的集训精品课程。课程主要讲解基于Hadoop分布式大数据架构思想、Hadoop HDFS、MapReduce和Hbase等理论知识和Spark大数据分析工具,通过演示实际案例详细演示Spark大数据处理流程,使学员能在较短的时间内理解大数据分析的真实价值。

https://www.cda.cn/kecheng/35.html



2.《CDA大数据就业班第5期》(北京3.5开课)

课程以2个月基础课程加1个月选修课程(SAS和Python方向)展开,使学员全面学会Hadoop集群架构原理和使用场景,掌握Hadoop、HDFS、MapReduce、Hbase、Hive、Sqoop等理论知识和大数据平台生态环境。重点掌握数据分析基础和数据挖掘经典算法实现,Spark大数据分析工具和Python完美结合让你事半功倍。真正深入实际的项目案例进行大数据的实战开发,达到大数据分析师的理论和实战要求。

https://www.cda.cn/kecheng/7.html


3.《CDA团课:机器学习与R语言实战》(线上12.24开课)

课程以线上直播方式,两个周末共4天课程。主要讲授R实现机器学习为主题,讲解如何利用R完成机器学习领域回归分析、决策树、支持向量机、人工神经网络等监督学习和聚类分析、关联规则等非监督学习等内容,以丰富的案例分析,讲授R实现机器学习的方法和技巧。每章都会给出数据集和相应的代码,并会详细讲解代码的实现,让学员轻松掌握R,分析来自不同领域的数据。

http://ai.pinggu.org/ml.html


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-12-5 15:48:50
学大数据必学hadoop生态系统 以及spark的大数据处理工具
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-5 15:49:32
2016.12.7(周三)晚19:30-21:00    主题:基于Spark的用户行为路径分析的产品化实践
2016.12.10(周六)晚19:30-21:00  主题:Hadoop进阶之网站海量日志KPI指标分析
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-5 15:50:11
上次峰会上一面未再见,期待辛老师  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-5 15:52:05
芥末先生 发表于 2016-12-5 15:50
上次峰会上一面未再见,期待辛老师
这次辛老师干货满满!欢迎关注周六的直播
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-5 15:53:07
学习大数据,首选CDA大数据分析师课程,老师们挺给力,学习后也有大数据交流平台。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群