经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析师(CDA)专版
Web网站日志分析,小白也能学会的大数据技术
楼主
ZQZ520
26222
146
收藏
2017-06-08
一、
大数据
时代背景
1.纽约股票交易所,每天产生数据量为4-5 terabytes(兆字节)
2.Facebook有超过240 billon照片 ,每个月增长7 petabytes,每天有18亿张照片上传或被传播,形成海量数据
3.家谱网站Ancestry.com,存储约10 petabyte数据
4.互联网档案约存储18.5 petabytes数据
5.瑞士日内瓦附近的大型粒子对撞机,每年产生约30 petabyte数据
6.2015年落成的世界最大观天望远镜主镜头像素为3.2G,每年将产生6PB天文图像数据;
7.欧洲生物信息研究中心(EBI)基因序列数据库容量已达5PB;中国深圳华大基因研究所成为全世界最大测序中心,每天产生300GB基因序列数据(每年100TB)
二、为什么需要Hadoop
Hadoop已经被业界公认为是用于大数据的通用存储和分析平台”,许多大型企业软件供应商,开始对Hadoop提供商业支持,包括EMC、IBM、Microsoft和Oracle,以及专门的Hadoop公司如Cloudera、Hortonworks和MapR。
Hadoop应用大致可以分为这两类:
IT优化:
已经实现的应用和业务搬迁到Hadoop平台,以获得更多的数据、更好的性能或更低的成本。这几年Hadoop在数个此类应用场景中已经被证明是非常适合的解决方案,包括:历史日志数据在线查询、ETL任务、数据仓库offload
业务优化
在Hadoop上实现原来尚未实现的算法、应用,从原有的生产线中孵化出新的产品和业务,创造新的价值,通过新业务为企业带来新的市场和客户,从而增加企业收入。
三、大数据应用——Web网站日志分析
案例演示流程:
step 1:
使用Flume来完成Apache服务器日志收集工作,并自动上传到指定的HDFS系统中存储;
step 2:
使用MapReduce将HDFS中进行数据清洗
step 3:
使用Hive对清洗后的数据进行统计分析
step 4:
使用Sqoop将Hive统计后的数据导出到关系型数据库MySQL
step 5:
使用数据可视化技术呈现分析结果
Web网站日志案例具体应用参考以下视频
小白如何快速大数据领域呢?现在有一个好机会,CDA就业班助你圆梦,高薪就业。
CDA数据分析研究院总结了数据分析师的成长历程,根据企业不同阶段的用人需求研发出了「CDA数据分析就业培训班」和「CDA大数据分析就业培训班」课程体系,以数据分析理论与实践案例结合的方式讲授,内容覆盖了国内企业招聘数据分析师岗位所需的技能,学员经过全面的脱产学习,达到企业用人标准,快速在大数据时代找准工作定位,抓住大时代的大机遇!
CDA就业班近期开课计划
第六期CDA大数据分析就业班6月18日于北京开课
十一期CDA数据分析就业班6月25日于北京开课
十二期CDA数据分析就业班7月9日于深圳开课
十三期CDA数据分析就业班7月23日于上海开课
(北京现场班)
(远程直播班)
PS:6月9日本期就业班毕业答辩,实用的毕业设计报告,感兴趣企业和个人可以私聊课程老师。
在线咨询:
座机:010-68456523(张老师)
QQ:
2881989712
邮箱:
zhangwei@pinggu.org
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
colongkong
2017-6-8 10:29:31
现在所有的中大型互联网平台侧日志处理都是采用这个架构
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
ZQZ520
2017-6-8 13:08:33
Hadoop已经被业界公认为是用于大数据的通用存储和分析平台”,许多大型企业软件供应商,开始对Hadoop提供商业支持,包括EMC、IBM、Microsoft和Oracle,以及专门的Hadoop公司如Cloudera、Hortonworks和MapR。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
0795fights
2017-6-8 13:10:17
在Hadoop上实现原来尚未实现的算法、应用,从原有的生产线中孵化出新的产品和业务,创造新的价值,通过新业务为企业带来新的市场和客户,从而增加企业收入。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
laah9254
2017-6-8 13:19:16
高考作文题都涉及数据分析了,想转行大数据的朋友可以多关注下。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
地板
face645
2017-6-8 14:08:50
老师讲解的挺到位,能清楚知道业务流程。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
点击查看更多内容…
7楼
殺先生
2017-6-8 14:23:48
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
8楼
Crsky7
2017-6-8 15:01:13
文本挖掘非常困难
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
9楼
sqy
2017-6-8 16:14:14
ding!!!!!!!!!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
10楼
Charlie·T
2017-6-8 16:31:16
大数据时代
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
11楼
auirzxp
2017-6-8 17:10:22
提示:
作者被禁止或删除 内容自动屏蔽
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
12楼
h_y_zhou163
2017-6-9 00:00:52
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
13楼
shifeng758
2017-6-9 02:08:02
坎坎坷坷扩扩扩扩扩扩扩扩扩扩扩扩扩
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
14楼
huhuhuhu
2017-6-9 05:46:22
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
15楼
cugsong
2017-6-9 06:24:34
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
16楼
soccy
2017-6-9 06:57:53
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
17楼
太史公
2017-6-9 07:44:21
太史公 , 您累计已签到
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
18楼
HappyAndy_Lo
2017-6-9 08:40:57
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
19楼
gewenhong66
2017-6-9 08:45:56
thank a lot
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
20楼
宏华
2017-6-9 09:03:29
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
21楼
cxzbb
2017-6-9 09:12:32
不错……
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
22楼
xmuzhl
2017-6-9 09:13:13
dinggggggggggggggg
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
23楼
dgy203
2017-6-9 10:01:18
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
24楼
961938985
2017-6-9 10:25:42
赞,一直想学
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
25楼
yc1221
2017-6-9 14:06:45
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
26楼
yc1221
2017-6-9 14:06:52
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
27楼
突突强
2017-6-9 14:49:33
过程不错
案例演示流程:
step 1:
使用Flume来完成Apache服务器日志收集工作,并自动上传到指定的HDFS系统中存储;
step 2:
使用MapReduce将HDFS中进行数据清洗
step 3:
使用Hive对清洗后的数据进行统计分析
step 4:
使用Sqoop将Hive统计后的数据导出到关系型数据库MySQL
step 5:
使用数据可视化技术呈现分析结果
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
28楼
rossrachel
2017-6-9 15:05:51
支持一下!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
29楼
yanch9
2017-6-9 17:06:20
大数据时代的到来不以人的意志为转移
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
30楼
行走的青年
2017-6-9 20:44:59
Big Data Time IS Coming!!!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
首页
上一页
下一页
跳至第
页
相关推荐
阿里影业处女作:用大数据技术打造《摆渡人》
大数据技术是否适合应用于ZF
2015大数据技术与产业应用大会[不限]
大数据技术与产业应用大会
大数据技术基础————讲义PDF
2015大数据技术峰会,解码数据未来
第二届大数据技术与产业应用大会
2016第二届大数据技术与产业应用大会
关注2016年第三届大数据技术与产业应用大会
大数据技术盘点_大数据
栏目导航
数据分析师(CDA)专版
悬赏大厅
计量经济学与统计软件
Stata专版
微观经济学
商学院
热门文章
2026“课题申报”抢跑号角的已吹响!国社科 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
英文书籍
英文书籍
国家级都市圈谁在领跑:2025华高莱斯产城瞭 ...
中国移动:智能体互联网技术白皮书2025
超越普里瓦洛夫无穷乘积与它对解析函数的应 ...
超越普里瓦洛夫数项级数卷
您提出了一个足以获得诺贝尔奖的核心概念— ...
2012-2024年上市公司工业机器人渗透率数据集 ...
推荐文章
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
高校老师和学生都在偷偷上的智能体课,到底 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群