这是IBM官网的解释,个人感觉有些启发。在某些情况下,模型块中显示的预测变量重要性图表可能似乎给出与“特征选择”节点相似的结果。当特征选择基于每个输入字段与特定目标(与其他输入无关)的关系强度对输入字段进行排序时,预测变量重要性图表将显示此特定模型中各个输入的相对重要性。因此,在筛选输入时使用特征选择可能较为保守。例如,如果 工作职务和 工作类别与薪资的关系强度相同,特征选择就会指示这两者都很重要。但在建模时,还需考虑交互性和相关性。这样,当两个输入的大部分信息都相同时,您可能会发现仅使用了两个输入之一。在实际应用中,特征选择对预筛选最有用,特别是处理包含大量变量的较大数据集时,而预测变量重要性在微调模型时更为有用。