楼主的因变量是对中央ZF的信任,具体类别又分为非常信任、比较信任、一般、比较不信任、非常不信任、无法理解问题、无法选择、拒绝回答。这个此项设计的没问题,但在构建logistic回归模型时可能需要采取一定的措施才能建模了。为什么这么说呢,一是因变量里面的前几项(非常信任、比较信任、一般、比较不信任、非常不信任)这个是有序排列的,如果仅对这几项的样本构建logistic回归模型那要用有序多分类Logistic回归模型。再看后面的几项(无法理解问题、无法选择、拒绝回答),这几项又是无序多分类的。如果要对这几项的样本进行分析那就要用无序多分类logistic回归模型。鉴于此,我的建议如下:
一是楼主自己看看因变量各个类别对应的样本量多少,如果后面的几项(无法理解问题、无法选择、拒绝回答)样本量不多,而楼主的总样本量又比较大,我的建议是将这几项舍去,直接构建有序多分类Logistic回归模型探讨影响中央ZF的信任的因素。
二是如果后面的几项(无法理解问题、无法选择、拒绝回答)样本量很多,没法进一步舍去,我的建议是将非常信任、比较信任、一般、比较不信任、非常不信任这几项词条对应样本合并为能明确评价个体。然后无法理解问题、无法选择、拒绝回答几项构建无序多分类Logistic回归模型,探究其影响因素的选择。