经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
有谁比较了解有监督的离散化方法
楼主
彼岸没有灯塔
7081
2
收藏
2015-08-25
请教一下,基于熵的离散化方法(分箱),在R语言里怎样实现,有相应的包,或者函数吗。
另外我了解到还有一种基于卡方的离散化方法,有没有现成的工具包呢?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
msw731
2016-1-6 14:17:10
据我了解目前基于熵(或者叫基于信息增益)的离散化分箱方法最好的就是MDLP(Minimal Description Length Principle最短描述长度原则)方法。基本思想是:如果分组后的输入变量对输出变量取值的解释能力显著低于分组之前,那么这样的分组是没有意义的。所以,待分组变量(视为输入变量)应在输出变量的“指导”下进行分组。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
樱井慕心
2017-10-10 10:45:27
这个熵看起来容易,解释起来有点难
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
恳请帮忙,离散化问题!
R语言 有没有 直接生成 质素(素数)的函数?
请问以下r语言工具包是做什么用的
财会类有没有必要去学习R语言SAS之类的大数...
三组耐抗线R语言实现
求R语言资料
R语言如何对连续数据进行等深(等频)分箱?
R语言实现连续数据离散化
有没有什么R语言的初学者的推荐的书?
r语言中,两个向量夹角余弦除了自己写公式计算!有没有相应的函数直接计算的啊?
栏目导航
R语言论坛
世界经济与国际贸易
论文版
市场营销
经管高考
宏观经济学
热门文章
表格结构数据的核心特征及具象实例解析
毕马威 - 中国内地与香港IPO市场2025年回顾 ...
2026中信里昂风水指数
高教现代数学基础23 矩阵计算六讲 徐树方,钱 ...
求Journal of Computational and Graphical ...
查找文献Digital mapping of soil organic ...
《技术的本质》epub版本
精准匹配,菁英相伴--经管之家单身俱乐部, ...
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
Stata 19.0 Win 安装文件
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群