全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
10311 2
2016-05-28
如下内容全部亲测,有需要的亲可以参考,如有错误欢迎指出。
mac环境下r环境配置1、下载安装mac版r,x11及rstudio;
2、安装顺序:首先安装r及x11,再安装rstudio;
3、mac环境下RODBC的安装:
   1.ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
   2.brew update && brew install unixODBC

.csv 数据导入到R中
1、对于csv文件在R中标准的格式为:

即,第一行为数据框各分量的名字,随后的每一行第一项为行标签,其余为数据。
如果不符合这样的默认格式,需要在导入函数中指定特定的参数。
2、utils包,借此可导入”.csv”文件,具体函数用法如下:
read.table(file, header = FALSE, sep = "", quote = "\",
           dec = ".", row.names, col.names,
           as.is = !stringsAsFactors,
           na.strings = "NA", colClasses = NA, nrows = -1,
           skip = 0, check.names = TRUE, fill = !blank.lines.skip,
           strip.white = FALSE, blank.lines.skip = TRUE,
           comment.char = "#",
           allowEscapes = FALSE, flush = FALSE,
           stringsAsFactors = default.stringsAsFactors(),
           fileEncoding = "", encoding = "unknown", text)

一些主要的参数:

  • file : 要处理的文件。可以用字符串指定文件名,也可以使用函数,如:file('file.dat',encoding='utf-8')
  • header:首行是否为字段名。如果不指定,read.table()会根据行标签进行判断,即如果首行比下面的行少一列,就是header行
  • col.names: 如果指定,则用指定的名称替代首行中的列名称
  • sep:指定分隔符。默认为空白符(空格,制表符,换行符等)。可以指定为' ', '\t'等
  • quote:指定字符串分隔符,如" 或 '
  • na.strings: 指定缺损值。默认为NA
  • fill :文件中是否忽略了行尾字段。如果有,必须指定为 TRUE
  • strip.white:是否去除字符串字段首尾的空白
  • blank.lines.skip:是否忽略空白行,默认为TRUE。如果要指定为FALSE,需要同时指定 fill = TRUE 才有效
  • colClasses:指定每个列的数据类型
  • comment.char : 注释符。默认使用#作为注释符号,如果文件中没有注释,指定comment.char = "" 会比较安全 (也可能让速度比较快)

为了使用方便,read.table()函数还提供了一些变体,这些变体为read.table()的一些参数设定了默认值:

read.csv(file, header = TRUE, sep = ",", quote = "\"",         dec = ".", fill = TRUE, comment.char = "", ...)read.csv2(file, header = TRUE, sep = ";", quote = "\"",          dec = ",", fill = TRUE, comment.char = "", ...)read.delim(file, header = TRUE, sep = "\t", quote = "\"",           dec = ".", fill = TRUE, comment.char = "", ...)read.delim2(file, header = TRUE, sep = "\t", quote = "\"",            dec = ",", fill = TRUE, comment.char = "", ...)例: 2018B767-6D4D-4F2F-BE0C-CBA4C23B51B2.png
excel数据导入r环境中1、安装readxl包/gdata包
2、利用read_excel/read.xls导入
read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = “”,skip = 0)参数说明:
1、path:文件存储路径及文件名(含扩展名),如Mac环境中输入为:/Users/aiqingjiel/Desktop/data1.xlsx
2、col_name=TURE:第一行为列字段名,如col_name=FALSE,R以X01,X02,……,Xn来代替列字段名;
3、col_type=NULL:导入的电子表格或向量中可能包含空白,数值,日期或text文本;
4、na=“”,默认讲点子表哥中空白单元格转换为缺失的值;
5、skip=0:在读取数据前,每行数据不回有遗漏

例:
5C32C37D-3259-4066-AC90-465DF8E70888.png
read.xls(xls, sheet=1, verbose=FALSE, pattern, na.strings=c("NA","#DIV/0!"),         ..., method=c("csv","tsv","tab"), perl="perl”)
参数说明:1、xls:同上述path;2、sheet=1:导入电子表格中的第一个sheet;3、verbose=FALSE:当前r处理的文件不被打印;4、pattern:if specified, them skip all lines before the first containing this string5、method:逗号分隔或tab分隔的中间文件格式6、perl:name of the perl executable to be called例: C12EB3E5-7245-4158-81FC-DBE9A693360C.png




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-10-11 15:55:54
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-4-27 17:50:12
问下Users是固定输入项吗,后面一个是自己电脑的用户名吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群