全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3152 3
2018-12-08
近期在学习神经网络和支持向量基,看了不少例子,基本上输入变量都是连续型,而实际应用场景中会出现不少类别型的输入变量,这些变量可能是标记型(是1/否0)、类别型(1、2、3代表几类)、有序型(1、2、3有序的类别),对于这些类型的变量在建模时又该如何处理?是转化为虚拟变量?还是?请专业前辈指点指点!或者推荐优秀书籍可供学习,万谢!
另有一疑问,本人在试验神经网络时,使用了SPSS modoler 一开始是将几种类型的变量都作为输入,末作任何预处理,最终模型自已选择出有影响的变量,基本都是连续型变量,预测准确率在78%。
当我只选择连续型的变量,并且对变量用极差法做归一化后再参与建模,有影响的变量出现较大变化,预测准确率下降为75%,但对于yes类的响应率都有显著的提升。是否应以第二种结果为准?
附件列表

telco.zip

大小:51.58 KB

 马上下载

spss数据集

本附件包括:

  • telco.sav

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-12-8 18:47:23
这部分,是数据分析中,最艺术的部分,全凭工匠手艺之熟练程度。。一个主题词”Feature Engineering“,可查到一些有关这方面的书或研究论文。 是否有用,全凭你的经验!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-8 21:45:00
jgchen1966 发表于 2018-12-8 18:47
这部分,是数据分析中,最艺术的部分,全凭工匠手艺之熟练程度。。一个主题词”Feature Engineering“,可 ...
谢谢前辈!看来这是要不断尝试并结合产出价值来决定的!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-14 21:56:42
多谢多谢!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群