我在做一道题,问题做到这里有一个疑问:如何在有哑变量的情况下,对给出的所有变量进行筛选,选出对因变量有影响的自变量呢?
我使用了logistic模型解决(Anaylyze->Regreesion->binary logistic),结果显示没有一个变量是对Target_B有影响的,感觉这样的结果不对。所以急切的向大人们请教,能说说你们自己的观点吗?
下面是题目,问题标红部分是我自己不知道该用什么模型解决的。
题目:数据集donor记录了某一间非盈利慈善组织的捐赠者的个人信息(var1-var6),以往捐款情况(var7-var13),以及对本次捐款宣传的回应(var14-var15)。其中每个变量的含义如下:
Var1 Age 捐赠者的年龄
Var2 Homeowner H=拥有私人住宅;U=不知道;空格=缺失值
Var3 Income 收入水平:从 0 到 7
Var4 Gender F=女, M=男
Var5 Pets Y=捐赠者拥有宠物;N=捐赠者没有宠物
Var6 Pcowners Y=捐赠者拥有个人电脑;N=捐赠者没有个人电脑
Var7 Cardprom 对捐赠者进行“使用信用卡捐款”宣传的次数
Var8 Numprom 对捐赠者进行捐款宣传的总次数
Var9 Cardgift 捐赠者对“使用信用卡捐款”宣传的捐赠额
Var10 Timelag 捐赠者第一次捐赠与第二次捐赠的时间间隔
Var11 Lastt 捐赠者上一次捐赠到本次捐赠活动的时间
Var12 Firstt 捐赠者第一次捐赠到本次捐赠活动的时间
Var13 Avggift 捐赠者以往的平均捐款额
Var14 Target_B 1=捐赠者对本次筹款活动进行了捐款;0=捐赠者对本次筹款活动没有捐款
Var15 Target_D 捐赠者本次捐款的实际数额
对数据集进行描述统计分析;选取适当的变量对捐赠者进行聚类分析;以捐赠者对本次捐款宣传的回应为因变量运用适当的统计方法分析影响捐赠者本次捐赠行为的因素;根据你的分析结果,给出建议:该慈善机构应如何选取捐赠者对下一次捐款活动进行宣传?