全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1831 5
2017-09-21
求分享一些机器学习里feature selection的方法
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-9-21 08:56:29
http://blog.csdn.net/column/details/15615.html
可以看一下这个,特征选择大多出现在论文中,要更深入研究可以搜索其中的论文。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-21 13:48:04
简单的有计算一些统计方法、指标进行筛选,如单因素方差分析、卡方检验、特征与响应变量之间的相关系数、距离相关系数、信息增益、Gini系数等;复杂一点的用逐步回归、遗传算法、岭回归、lasso回归、弹性网络等,或者用一些模型计算变量重要性,如随机森林、决策树等等
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-23 22:41:29
阿扁V5 发表于 2017-9-21 13:48
简单的有计算一些统计方法、指标进行筛选,如单因素方差分析、卡方检验、特征与响应变量之间的相关系数、距 ...
不平衡数据有什么特别的方法吗?
我现在是先用信息增益, 随机森林什么的初选,然后模型用xgboost,调参,再之后想做一个更细致的特征选择,主要是因为production 的时候特征太多不方便。有什么建议吗?

谢啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-24 16:34:20
不平衡数据用过采样或者欠采样,欠采样比较简单,就是从多类抽取和少类相同个数的样本,过采样可以用smote方法生成新样本,r有smote函数,特征的进一步选择建议用lasso或者弹性网络,筛选得到标准化系数稳定且显著的变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-11-13 11:06:53
先占坑,回头再回答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群