经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
有谁比较了解有监督的离散化方法
楼主
彼岸没有灯塔
6982
2
收藏
2015-08-25
请教一下,基于熵的离散化方法(分箱),在R语言里怎样实现,有相应的包,或者函数吗。
另外我了解到还有一种基于卡方的离散化方法,有没有现成的工具包呢?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
msw731
2016-1-6 14:17:10
据我了解目前基于熵(或者叫基于信息增益)的离散化分箱方法最好的就是MDLP(Minimal Description Length Principle最短描述长度原则)方法。基本思想是:如果分组后的输入变量对输出变量取值的解释能力显著低于分组之前,那么这样的分组是没有意义的。所以,待分组变量(视为输入变量)应在输出变量的“指导”下进行分组。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
樱井慕心
2017-10-10 10:45:27
这个熵看起来容易,解释起来有点难
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
恳请帮忙,离散化问题!
R语言 有没有 直接生成 质素(素数)的函数?
请问以下r语言工具包是做什么用的
财会类有没有必要去学习R语言SAS之类的大数...
三组耐抗线R语言实现
求R语言资料
R语言如何对连续数据进行等深(等频)分箱?
R语言实现连续数据离散化
有没有什么R语言的初学者的推荐的书?
r语言中,两个向量夹角余弦除了自己写公式计算!有没有相应的函数直接计算的啊?
栏目导航
R语言论坛
人力资源管理
金融实务版
经管类求职与招聘
人工智能论文版
Stata专版
热门文章
你的SSCI发表焦虑,AI真的能懂吗?——一篇 ...
CDA数据分析脱产就业班于2025年08月02日开班 ...
数生万物,转型之本:数据资产运营白皮书-毕 ...
Machine-Learning-Tom-M.-Mitchell中文版.p ...
2025年中国城市可信数据空间行业研究报告
十四五能源发展成就报告
《统计分析与spss的应用(第五版)》数据.r ...
生成式人工智能应用发展报告(2025)
上海黄金及贵重金属月、日交易文件2002-202 ...
全球世界各国地区黄金储备量2000-2050831季 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群