全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1427 4
2017-02-16

SparkR是R的一个包,从R上提供一个轻量级前端使用Apache Spark,即提供了Spark中弹性分布式数据集的API(applicationprogramming interface ),用户可以在集群上通过Rshell交互性地运行job。Spark的 API由Spark Core的API以及各个内置的高层组件(Spark Streaming,Spark SQL,ML Pipelines和MLlib,Graphx)的API组成,目前SparkR只提供了Spark的两组API的R语言封装,即Spark Core的RDDAPI和Spark SQL的DataFrame API。

目前感觉sparkR的DataFrame API比较成熟了,且容易操作,但是用的算法包目前spark2.1.0才十几个,不能直接运用R自带包。  而 sparkR RDD API 操作可以调用R自带包,但操作比较麻烦(这块现在不会做,求大神指导)!!??

欢迎入群互相交流 188529107


自己做了个sparkR的图大神看看对不对!! sparkR实操.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-2-22 10:38:18
谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-1 15:21:38
请大家注意,版面中qq群已解散,欢迎大家加入sparkR学习交流群:487171061
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-1 16:55:41
superzhang90 发表于 2017-2-16 16:34
SparkR是R的一个包,从R上提供一个轻量级前端使用Apache Spark,即提供了Spark中弹性分布式数据集的API(ap ...
多谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-9 09:39:36
Rstudio出了sparklyr包,可以看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群