全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
13333 9
2018-05-03
建立了一个线性的回归模型,想要用该模型去得到测试集中要预测的数据,应该怎么用R来实现呢?
predict函数好像是进行预测的函数,但是在R里面就算把测试集的数据放进去,得到的也只是训练集中的数据,这是为什么呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-5-3 22:23:01
最好能把代码发上来 其他人才能更好帮到你
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-4 09:25:26
谢谢提醒,下面是代码,希望大神能解答下:
lm_function=lm(formula = datatrain$Item_Outlet_Sales~datatrain$Item_Weight+datatrain$Item_Fat_Content+datatrain$Item_Visibility+datatrain$Item_MRP+datatrain$year+datatrain$Outlet_Size+datatrain$Outlet_Location_Type+datatrain$Outlet_Type+datatrain$Item_Visibility_Ratio)  #用线性回归模型进行建模,因变量是datatrain$Item_Outlet_Sales
predict(lm_function,datatest)   #用得到的回归模型,对测试集datatest进行判断
运行完predict后,总是出错:
Warning message:
'newdata' had 5681 rows but variables found have 8523 rows
说明:5681 rows是datatest中的数据的行数,8523 rows 是datatrain中的数据的行数
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-5 10:30:37
你在train中用于建模预测的变量是否与测试集dataset变量名完全一致??
威哥每个变量前面都有一个前缀datatrain
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-5 20:33:17
420948492 发表于 2018-5-5 10:30
你在train中用于建模预测的变量是否与测试集dataset变量名完全一致??
威哥每个变量前面都有一个前缀data ...
是完全一致的,而且我也在变量前面加了datatrain啊。请问你知道该怎么解决吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-6 09:51:36
saly@123 发表于 2018-5-5 20:33
是完全一致的,而且我也在变量前面加了datatrain啊。请问你知道该怎么解决吗?
方便上传个几十行的模拟数据集吗?可以试一下,看看是什么原因,比如变量类型是否一致,取值是否相同
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群