三、安装
由于网络限制,只能先将源文件下载到本地,然后通过shell命令R CMD INSTALL ‘package_name’来安装。
a) 首先安装rhdfs。该包依赖于包 rJava。所以还需要先下载rJava的源代码并安装。
R CMD INSTALL ‘rJava_0.9-3.tar.gz’
R CMD INSTALL ‘rhdfs_1.0.1.tar.gz’
在执行安装rJava时,可能会失败,提示错误信息“checking whether JNI programs can be compiled... configure: error: Cannot compile a simple JNI program. See config.log for details.”,这可能是由于jdk的版本问题造成的,建议安装jdk1.6。
b) 安装rmr。该包依赖于包RJSONIO、 itertools 、digest,而包itertools 又依赖于iterators。
R CMD INSTALL ‘iterators_1.0.5.tar.gz’
R CMD INSTALL ‘itertools_0.1-1.tar.gz’
R CMD INSTALL ‘RJSONIO_0.96-0.tar.gz’
R CMD INSTALL ‘digest_0.5.1.tar.gz’
R CMD INSTALL ‘rmr_1.1.tar.gz’
c) 安装rhbase(参见https://github.com/RevolutionAnalytics/RHadoop/wiki/rhbase)。在安装rhbase之前,还需要安装Thrift库,建议安装Thrift 0.6.1版本,下载网址为http://thrift.apache.org/。详细的安装步骤如下:
ii. 解压并安装Thrift。
tar -zvxf thrift-0.6.1.tar.gz
cd thrift-0.6.1
./configure --with-boost=/usr/include/boost JAVAC=/usr/jdk1.6/bin/javac
make
make install
其中—with-boost及JAVAC的值根据服务器的实际情况进行修改(不确定javac的设置是不是必须的)。
iii. 设置环境变量PKG_CONFIG_PATH。
在/etc/profile中输入
export PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/lib/pkgconfig/(并通过命令souce /etc/profile命令使得环境变量生效)。之后输入shell命令pkg-config --cflags thrift验证pkg-config路径是否设置正确,返回结果若为-I/usr/local/include/thrift则表示成功。
iv. 复制library文件。
cp /usr/local/lib/libthrift.so.0 /usr/lib