应该用logistic回归(logistic regression)来分析。logistic regression是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。附件是logistic regression在医学中应用的讲稿,讲的比较详细,楼主可以看看。
因子分析可以用来减少数据量,但我觉得这里没太大必要。楼主的例子里,危险因素(自变量)只有20项,没有必要去提取因子了;更重要的是,因子分析后最困难的是对因子的解释。显然,在这里用直接观测量更好解释。