全部版块 我的主页
论坛 数据科学与人工智能 大数据分析 spark高速集群计算平台
3066 5
2015-05-08
自数据挖掘专题和Hadoop专题[链接在文末]发布以来,数据挖掘逐渐转入大数据时代,尤以Spark平台All in one的特性备受工业界青睐,于是再发布一个Spark专题,与广大学友交流。

工作繁忙,具体图片和目录就不发了,请各位自行google,相信能学到更多。
PS:目录已补充至楼下
————
SPARK01 Learning Spark
Karau et al. - 2015 - SPARK01 Learning Spark.zip
大小:(6.81 MB)

只需: 5 个论坛币  马上下载

本附件包括:

  • Karau et al. - 2015 - SPARK01 Learning Spark.pdf



SPARK02 Advanced Analytics with Spark
Ryza et al. - Unknown - SPARK02 Advanced Analytics with Spark.zip
大小:(3.62 MB)

只需: 5 个论坛币  马上下载

本附件包括:

  • Ryza et al. - Unknown - SPARK02 Advanced Analytics with Spark.pdf



SPARK03 Machine Learning with Spark
Noh - 2014 - SPARK03 Machine Learning with Spark.zip
大小:(4.27 MB)

只需: 5 个论坛币  马上下载

本附件包括:

  • Noh - 2014 - SPARK03 Machine Learning with Spark.pdf


————

PPS:
——————————————————
所有专题索引:
01.数据挖掘专题:https://bbs.pinggu.org/thread-2161511-1-1.html
02.机器学习专题:https://bbs.pinggu.org/thread-3702096-1-1.html
03.Hadoop大数据平台专题:https://bbs.pinggu.org/thread-2515116-1-1.html
04.Spark大数据平台专题:https://bbs.pinggu.org/thread-3702039-1-1.html



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-5-8 11:09:29
补充个outline吧还是:
Spark01
1. Introduction to Data Analysis with Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. Downloading Spark and Getting Started. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Programming with RDDs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4. Working with Key/Value Pairs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5. Loading and Saving Your Data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6. Advanced Spark Programming. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7. Running on a Cluster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8. Tuning and Debugging Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9. Spark SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
10. Spark Streaming. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
11. Machine Learning with MLlib. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213


Spark02
1. Analyzing Big Data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. Introduction to Data Analysis with Scala and Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Recommending Music and the Audioscrobbler data set. . . . . . . . . . . . . . . . . . . . . . . . . . 37
4. Predicting Forest Cover with Decision Trees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5. Anomaly Detection in Network Traffic with K-means clustering. . . . . . . . . . . . . . . . . . . 79
6. Understanding Wikipedia with Latent Semantic Analysis. . . . . . . . . . . . . . . . . . . . . . . . . 9
7. Analyzing Co-occurrence Networks with GraphX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8. Geospatial and Temporal Data Analysis on the New York City Taxicab Data. . . . . . . . . 145
9. Financial Risk through Monte Carlo Simulation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
10. Analyzing Genomics Data and the BDG Project. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
11. Analyzing Neuroimaging Data with PySpark and Thunder. . . . . . . . . . . . . . . . . . . . . . . 207
12. Appendix: Deeper Into Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
13. Appendix: Upcoming MLlib Pipelines API. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

Spark03
Chapter 1: Getting Up and Running with Spark  7
Chapter 2: Designing a Machine Learning System  37
Chapter 3: Obtaining, Processing, and Preparing Data with Spark  51
Chapter 4: Building a Recommendation Engine with Spark  83
Chapter 5: Building a Classification Model with Spark  117
Chapter 6: Building a Regression Model with Spark  161
Chapter 7: Building a Clustering Model with Spark  197
Chapter 8: Dimensionality Reduction with Spark  221
Chapter 9: Advanced Text Processing with Spark  247
Chapter 10: Real-time Machine Learning with Spark Streaming  279



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-22 10:53:17
所有专题索引:
01.数据挖掘专题:https://bbs.pinggu.org/thread-2161511-1-1.html
02.机器学习专题:https://bbs.pinggu.org/thread-3702096-1-1.html
03.Hadoop大数据平台专题:https://bbs.pinggu.org/thread-2515116-1-1.html
04.Spark大数据平台专题:https://bbs.pinggu.org/thread-3702039-1-1.html
05.算法专题(CLRS, DPV, KT, SW 4合1):https://bbs.pinggu.org/thread-4621817-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-14 00:10:50
hadoop hive  spark
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-7-15 14:23:18
谢谢楼主分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-7-16 09:17:28

谢谢楼主分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群