本月主题:那些年我们用过的分类算法
讨论框架:分类问题一直是数据挖掘或者机器学习应用中最重要的问题之一。如果能对两三种分类算法烂熟于心、得心应手,一定方便你拿到BAT或者银行等高大上公司的数据分析/建模offer。如果在客户流失、潜在高价值用户识别、欺诈识别等等领域有成功应用,包你入职定级从高级分析师起跳~
本期讨论将围绕常用分类器展开,比如glm类回归,SVM,决策树,随机森林。。。。。。(欢迎补充)
欢迎SVM派出来喷Logistic模型精度差,也欢迎logisitic派嘲讽随机森林是硬件杀手,总之越热闹越好
参与方法(以跟帖形式):
(1)分享资料:专题性质的讨论,越细节越好;各种数据源也好
(2)分享使用和学习心得
(3)直接参与讨论(也欢迎提问)
奖励方法
(1)将有价值的回帖设为精彩回复或直接编辑到主题帖中,供坛友学习
(2)只要是具有学习价值或者讨论价值的回帖,基于论坛币的奖励
(3)请不要进行无意义的回帖,诸如顶、学习一下等,表达支持可以通过给回帖评分的形式
(4)对参与活动特别热心且有突出贡献的坛友可推荐为本版热心会员或后备版主
温馨提示
(1)分享资料包括好的书籍、博文以及之前论坛的精彩回帖等,考虑到R的更新速度,请在分享前确认资料的有效性。
(2)鼓励免费分享,不建议收取论坛币,对于好的资料会有丰厚的论坛币补偿。
(3)R毕竟只是一个工具,在分享使用经验欢迎附上使用过程中的背景知识。
(4)建议对于回帖正文,除了部分难以翻译的英文关键词,请不要使用英文。
感谢大家对活动的倡议和努力,欢迎大家提出更多好的意见建议。