R语言-批量读取数据文件以及提取字符串中的数字——CDA人工智能学院

1802

收藏 2021-05-11

CDA 人工智能学院致力于以优质的人工智能在线教育资源助力学员的DT职业梦想！课程内容涵盖数据分析、机器学习、深度学习、人工智能、tensorFlow、PyTorch、知识图谱等众多核心技术及行业案例，让每一个学员都可以在线灵活学习，快速掌握AI时代的前沿技术。PS：私信我即可获取CDA会员1个月免费试听机会

#第一部分

#先将当前文件夹下的所有以csv结尾的文件名读进来

filelist <- list.files(pattern=".*.csv")

#文件个数
m<-length(filelist)

#按照文件名逐个读入数据，得到数据列表
datalist <- lapply(filelist, function(x) read.csv(x,header=F,stringsAsFactors=F))

#第二部分

library(stringr)#没装的请先安装

cha1<-c("a1","b23","c4","d56","e","f4")#这是6个字符串，每个字符串里面都包含数字，考虑如何把数字提取出来

col1<-str_extract_all(cha1,"\\d")#得到字符串列表，每个元素对应每个字符串的数字，但是不是你想象的那样

#具体形式是这样的：如23，得到的是"2" "3"，所以该怎样把它变成我们想要的数字23是个问题，解决方法如下：

  i<-1
  while(i<=length(col1)){
if(length(col1[])==0) col1<-col1[-i] else i<-i+1#这一步是考虑把没有数字的字符串对应的列表元素删掉，比如说"e"
  }
  col11<-numeric(length(col1))
  for(i in 1:length(col1)){
l1<-length(col1[])
l11<-c()
for(j in 1:l1)
   l11<-paste(l11,col1[][j],sep="")#将列表的每个元素连接起来，比如"2" "3"就变成了字符串"23"
col11<-as.numeric(l11)#再将链接好的字符串进行数值化
  }

col11<-col11[!duplicated(col11)]#有的数字在处理之后，即将字母去掉之后会有所重复，这步是向量去重处理（不需要去重的请忽略哈）

#补充两个个函数：
#1.删除字符串中的特定字符
gsub(a,b,c)：将字符串c中的a字符用b字符进行替换，例如：

gsub(" ","","Lin hai")#这样可以删除字符串中的空格

#2.读取excel数据时指定行和列进行读取
library(data.table)
data1 <- fread("数据.csv", skip=1, nrows=100, select=c(1:50),data.table=F,header=F) #读取前五十列，前一百行
#其中skip是起始行，nrows是终止行，select是所要读取的列号（也可以写成列名，如select=c("X1", "X2")，表示读取列名为X1，X2的变量）

扫码关注CDA公众号，即可获取“最新版数据分析题库大全”与“CDA免费精品课70+”

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

沙发

钱学森64

2021-5-11 20:20:05

谢谢分享

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

SAS并行读取数据问题

求助，利用obs读取数据的问题~~~~~~~~

一个ado程序，从数据文件读取数据进行计算，计算出来的数据如何保存啊

SAS读取数据文件

R语言中如何批量读取数据集

R语言，tm包怎么读取数据

plr语言的读取数据和保存数据

R语言读取数据、拆分数据，并保存到相应文件夹——CDA人工智能学院

设定工作目录与读取数据文件

关于sas读取数据文件的时候出现了乱码问题

栏目导航

数据分析与数据挖掘

经济金融数学专区

SAS专版

R语言论坛

真实世界经济学(含财经时事)

量化投资

热门文章

我该如何记住你？智能体记忆系统的演化之路

CDA数据分析脱产就业班于2026年3月7日开班！ ...

无上高明的“无为”“无住”哲学在传统中国

艾瑞咨询 - 2025年中国早教行业白皮书

第一太平戴维斯 - 2026年中国房地产市场展望 ...

2025中国居民退休准备指数调研报告-清华大学 ...

科研时间70%耗在“下载-复制-粘贴”？零代码 ...

精准匹配，菁英相伴--经管之家单身俱乐部， ...

CDA数据分析师：商业数据分析实践的核心执行 ...

CDA 认证考试大纲 2025 重磅更新：一二级考 ...

推荐文章

2026JG学术冬训营:从Stata初高到Python机器 ...

【必看】【本版版规，欢迎发悬赏贴求助】

26年寒假天津站｜Gemini论文写作&数据分析 ...

关于如何利用文献的若干建议

关于学术研究和论文发表的一些建议

关于科研中如何学习基础知识的一些建议 (一 ...

一个自编的经济学建模小案例 --写给授课本科 ...

AI智能体赋能教学改革: 全国AI教育教学应用 ...

2025中国AIoT产业全景图谱报告-406页

关于文献求助的一些建议

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群