全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
948 2
2018-12-08
近期在学习神经网络和支持向量基,看了不少例子,基本上输入变量都是连续型,而实际应用场景中会出现不少类别型的输入变量,这些变量可能是标记型(是1/否0)、类别型(1、2、3代表几类)、有序型(1、2、3有序的类别),对于这些类型的变量在建模时又该如何处理?是转化为虚拟变量?还是?请专业前辈指点指点!或者推荐优秀书籍可供学习,万谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-12-8 19:37:21
      这部分,是数据分析中,最艺术的部分,全凭工匠手艺之熟练程度。。一个主题词”Feature Engineering“,可查到一些有关这方面的书或研究论文。 是否有用,全凭你的经验!!!
    当然,想做好特征工程(Feature Engineering),对数据来源的专业领域,要相当熟悉!!
    SVM 开创者 Bernhard Scholkopf  当年用SVM 进行邮政编码数字识别,做得相当成功,以致SVM 普受关注与流传,但其成功的一个最重要部分之一,是 特征工程(Feature Engineering) ,但他在其书及论文中,很少谈及此细节!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-8 21:46:51
jgchen1966 发表于 2018-12-8 19:37
这部分,是数据分析中,最艺术的部分,全凭工匠手艺之熟练程度。。一个主题词”Feature Engineering“ ...
明白!谢谢前辈!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群