全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1462 5
2015-03-26
悬赏 10 个论坛币 未解决
我想试图做一个分类预测

现在我有几个不同文件 我只能用测试集做模型 但训练集和测试集里只有id号 没有其他信息

我需要从一个300多万的数据库里    匹配寻找测试集id的其它信息并粘贴到训练集里 该怎么做?

谢谢了

ps 还有我数据读不进去 它总说
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  :
  line 4 did not have 33 elements
该如何是好〉

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-26 02:22:38
我是来挽尊的 一楼沙发
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-26 08:39:40
检查一下数据格式,报错不是说第四行没有33列吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-26 11:17:47
qingdanry 发表于 2015-3-26 08:39
检查一下数据格式,报错不是说第四行没有33列吗?
谢谢!
我检查过了 发现是它没有把NA打上去,直接就空格了 删掉那些空格列就可以打开,我想把那些空格替换成na
但数据有300mb 根本无法用txt打开。。。。所以很悲催。。不过其实我更想知道第一个问题。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-26 11:20:22
BIG钊钊 发表于 2015-3-26 02:22
我是来挽尊的 一楼沙发
呜呜呜 大神帮帮我 不要只挽尊嘛
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-26 22:27:26
好吧 我自己找到了 用merge就可以。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群