全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1702 4
2012-05-21
我有一组数据,含因变量和自变量若千,现在有一组自变量残缺了几十个,我如何将他补全(预测)呢?
如果是因变量貌似可以用 分析 > 分类 > 判别 做出因变量预测,但是自变量如何操作啊?在线等,谢谢前辈们指点!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-5-21 11:08:03
有人用平均数,中位数或相邻的数据代替,或使用插值法解决。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-21 11:12:30
kuangsir6 发表于 2012-5-21 11:08
有人用平均数,中位数或相邻的数据代替,或使用插值法解决。
因为是一组客户数据的年龄部分,所以也不存在时间连续性,而残缺的这一部分恰好是值得研究的一个客户群体。如果用平均值或中位数代替,会导致这一部分“神秘客户”年龄一模一样,是否可以根据其他因变量和自变量推断出这组数据。谢谢指教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-21 11:31:41
1898666 发表于 2012-5-21 11:12
因为是一组客户数据的年龄部分,所以也不存在时间连续性,而残缺的这一部分恰好是值得研究的一个客户群体 ...
采用其他数据,把年龄当因变量建立模型,然后预测“神秘客户”的年龄。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-21 12:03:54
kuangsir6 发表于 2012-5-21 11:31
采用其他数据,把年龄当因变量建立模型,然后预测“神秘客户”的年龄。
谢谢,貌似只能这么着了,虽然出来的数据有点“飘”
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群