题目是这样,一个公司对4个部门(人数不同)进行问卷调查,问卷包含5道题. 题的答案只有YES和NO. 回答NO倾向于离职,回答yes倾向于留下. 问哪个问题是员工最关心的问题,即对员工离职影响最大。
现在知道每个部门人数,如(4,6,8,12),和每道题回答YES的比例,(如第一组的第一题是50%,即2人回答yes). 和离职的比例(如 第一组的离职比例是75%,即3人离职). 如何计算哪道题对离职影响最大呢?
我的思路: 开始想做logistic回归,但是数据不是individual的,是4个小组,每组人数都不同。 然后我就做多元线性回归,算出每个部门相对应每道题回答no的人数,和最后离职的人数. 五个题分别为X1-X5. 最终离职人数为Y. 进行回归分析. 从AVON中去排除P-VALUE较大的X,选出coefficient最大的X,即是对离职影响最大的问题。这个思路是对的么?
第二还问 哪两个问题组合起来时对最后离职影响最大。 两个独立影响不大的因素可能组合起来会造成更大的影响。这个如何来算呢? 需要对所有问卷问题分组然后求R方来看么?
求大神们解答。。本人非统计专业,求相信一些。
Thanks in advance.