全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
2664 5
2016-11-04
有两个Rdata格式的数据集,几百万条,在R里merge时报错,应该是内存不够。想在python里merge,请问如何实现呢?软件和包都已安装好,本人python小白。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-11-4 13:33:54
使用pandas。
import pandas as pd
data1 = pd.readcsv(yourpath)
data2 = pd.readcsv(yourpath)
newdata = data1.merge(data2,on=columnsname)   #columnsname为列名的list。
不会的查阅pandas的官网:http://pandas.pydata.org/pandas-docs/stable/10min.html。
python只有使用64位的不限制内存,32位的会限制内存使用2G左右。注意安装的时候看看版本。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-8 14:41:48
longgb246 发表于 2016-11-4 13:33
使用pandas。
import pandas as pd
data1 = pd.readcsv(yourpath)
非常感谢!那如何判断是否merge成功了呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-8 17:31:42
longgb246 发表于 2016-11-4 13:33
使用pandas。
import pandas as pd
data1 = pd.readcsv(yourpath)
AttributeError: 'module' object has no attribute 'readcsv'   我在读csv文件的时候总报错,请问您知道原因吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-14 10:39:50
floraclub 发表于 2016-11-8 17:31
AttributeError: 'module' object has no attribute 'readcsv'   我在读csv文件的时候总报错,请问您知道 ...
语法错误,应为 read_csv
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-14 16:27:45
floraclub 发表于 2016-11-14 10:39
语法错误,应为 read_csv
恩,当时是我凭印象写的,记得大概是这个函数,具体你查查pandas的官网。网址:http://pandas.pydata.org/pandas-docs/stable/10min.html
需要实现什么功能看官网就知道大概怎么弄了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群