全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
4688 1
2013-02-23
有一批销售数据要分析客户的购买因素,
自变量有:客户性别、年龄、城市、过往是否购买过同类或其他产品
因变量是:最终是否促销成功购买
数据共有5万多条,但只有700个购买成功
我用"因子分析"提取了两个“城市"和"过往是否购买产品"两个自变量但KMO只有0.5
之后用"线性回归"发现每个自变量的"R"值很低只有0.077,sig为0.0。

请问如下问题
1、由于KMO只有0.5,请问这两个变量是否不合适?如果真不合适,好像我的分析都做不下去了。求方法
2、线性回归的R值只有0.077左右很低, 而F值有154/Sig是0.0。 这样到底表示适不适合做线性回归啊?
3、回归的”系数”中,"城市"的B值是-5.43E我认为可删掉,是否?
4、而"过往是否购买产品"的B值是0.18,sig是0.0 , 是否可认为这个虽然相关,但相关度很低?或者可直接呼略?

求大神指点啊, 谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-2-24 15:20:46
Kaiser给出了常用的kmo度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。
因此按照结果,感觉用因子分析的结果不是太理想,方法可能选取不大合适。
遇到变量和数据很多时,老师给我们的建议是,先针对全部变量进行相关性检验,然后进行数据描述和绘图,从数据走势上推测数据关系(很多时候数据不仅仅是简单的一次线性关系,需要进行变换)构建相应模型,然后再运用合理的检验方法进行数据的拟合和检验。
纯属浅学之谈哈~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群