全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2431 1
2014-08-08
     目前在做电信的数据挖掘工作,对于一个具体问题,如C网离网分析,我们要做建模的话,首先要甄选建模字段。但是对于具体主题而言,它涉及到的字段非常的多。对于如何精简字段,可以通过 特征变量选择来甄选,但是这种效果不是很好。较好的方式是这样做的。            1.先用统计的方法,看看各个字段对目标变量的影响。
            统计对于不好的字段要删减,还有头脑风暴后选一些字段进来。
            2.训练集、验证集的框定。
            3.模型调优
            4.发布模型

            



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-8-8 22:11:20
langrenwanghu 发表于 2014-8-8 17:59
目前在做电信的数据挖掘工作,对于一个具体问题,如C网离网分析,我们要做建模的话,首先要甄选建模字 ...
黑暗中摸索
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群