全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6982 2
2015-08-25
请教一下,基于熵的离散化方法(分箱),在R语言里怎样实现,有相应的包,或者函数吗。
另外我了解到还有一种基于卡方的离散化方法,有没有现成的工具包呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-1-6 14:17:10
据我了解目前基于熵(或者叫基于信息增益)的离散化分箱方法最好的就是MDLP(Minimal Description Length Principle最短描述长度原则)方法。基本思想是:如果分组后的输入变量对输出变量取值的解释能力显著低于分组之前,那么这样的分组是没有意义的。所以,待分组变量(视为输入变量)应在输出变量的“指导”下进行分组。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-10-10 10:45:27
这个熵看起来容易,解释起来有点难
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群