全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2265 12
2021-11-17
大家好,我是R菜鸟,最近需要使用公共数据库的数据,因为数据集有很多个,都是CSV格式的,特别想用R实现多个CSV文件的合并,合并效果希望是dplyr包的full_join呈现的效果,百度尝试了很多方法,还是没有得到理想解决,希望大家能帮帮忙,谢谢啊!感谢!另外,还遇到一个问题,如果full_join数据集A有的,而数据集B无的单元格会赋值为NA,那是不是这个单元格对应的变量就变成了字符型变量呢,该怎么保持这个变量的性质不变呢?再次感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-11-18 06:20:47
首先,用str命令挨个检查每个文件的结构,你可以看到不同变量的类型。如果要合并的文件类型不同,需要预先调整。
其次,full_join合并出现NA是正常的。合并后,你可以根据自己的需要,去除缺省值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-18 10:10:06
1. 你都查到用 full_join() 了,那直接用不就行了;
2. NA 不一定是字符型。R会根据你该列的类型决定 NA 的类型,即如果你该列是数值型的,那么该列的 NA 也是数值型的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-18 16:17:17
s609078902 发表于 2021-11-18 10:10
1. 你都查到用 full_join() 了,那直接用不就行了;
2. NA 不一定是字符型。R会根据你该列的类型决定 NA  ...
感谢,因为我要合并的是多个CSV格式的数据集,我了解的是full_join只能一次合并两个,三个以上似乎就不行了,所以不知道怎么办了,苦恼中。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-18 16:19:44
s609078902 发表于 2021-11-18 10:10
1. 你都查到用 full_join() 了,那直接用不就行了;
2. NA 不一定是字符型。R会根据你该列的类型决定 NA  ...
关于第二个问题,我也会用R尝试看下数据类型,因为我是合并的数据集用SPSS打开后发现有原来数值型有NA的变量变成了字符型变量,正在尝试解决办法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-18 16:22:58
nieqiang110 发表于 2021-11-18 06:20
首先,用str命令挨个检查每个文件的结构,你可以看到不同变量的类型。如果要合并的文件类型不同,需要预先 ...
感谢,目前我的都是CSV格式的数据集,但是我不会三个及以上的数据集的合并呈现full_join效果,您能具体用代码教一下吗,感谢感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群