全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6661 15
2018-06-27
【求助】想做建筑能耗(碳排放)的回归预测模型,目前积累了40个样本(实际样本收集比较麻烦,所以样本很少),选取了17个自变量,各自变量与因变量的相关性也弱(有4个较强),请问应该考虑什么方法做预测模型吗?谢谢各位大侠指导。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-6-27 16:27:35
一般先拟合模型再扩充自变量数据然后预测因变量

不过你的自变量和因变量相关性较弱——仅有四个较强,个人觉得你可以先删选一下变量,且不说17个变量对于40个样本过多了这点,但是样本相关性的问题可能就会导致模型拟合效果差,参数不显著等问题,还不如挑选有代表性的变量来建立模型

个人意见供参考啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-6-27 16:32:33
胖胖小龟宝 发表于 2018-6-27 16:27
一般先拟合模型再扩充自变量数据然后预测因变量

不过你的自变量和因变量相关性较弱——仅有四个较强,个 ...
谢谢您的回复。因为建筑相关参数比较复杂,经考虑相关性较强的几个因素十分不合理。想综合考虑这些因素的影响进行预测模型的建立。关于数据库扩充,在考虑中,实在比较麻烦~且数据来源多不可靠。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-6-27 17:00:19
样本太少了,算也没什么意义
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-6-27 17:04:08
一个变量起码得5个样本,要达到最低要求,也得85个样本,否则误差太大
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-6-27 17:16:27
hzpv 发表于 2018-6-27 17:04
一个变量起码得5个样本,要达到最低要求,也得85个样本,否则误差太大
(1)有没有筛减变量的有效方法?或者确定显著影响因子的方法呢?
(2)使用主成分分析降维分析是否可行?
谢谢回答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群