近期在学习
神经网络和支持向量基,看了不少例子,基本上输入变量都是连续型,而实际应用场景中会出现不少类别型的输入变量,这些变量可能是标记型(是1/否0)、类别型(1、2、3代表几类)、有序型(1、2、3有序的类别),对于这些类型的变量在建模时又该如何处理?是转化为虚拟变量?还是?请专业前辈指点指点!或者推荐优秀书籍可供学习,万谢!
另有一疑问,本人在试验神经网络时,使用了SPSS modoler 一开始是将几种类型的变量都作为输入,末作任何预处理,最终模型自已选择出有影响的变量,基本都是连续型变量,预测准确率在78%。
当我只选择连续型的变量,并且对变量用极差法做归一化后再参与建模,有影响的变量出现较大变化,预测准确率下降为75%,但对于yes类的响应率都有显著的提升。是否应以第二种结果为准?