经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
R 重抽样SMOTE函数出现“ subscript out of bounds”错误
楼主
落陷的阳光
10372
3
收藏
2018-04-25
程序代码:
table(data.train.normalize$Y) # 违约样本占比约为0.2207143
fml = as.formula(paste("Y ~ ", paste("X",1:23, sep = "",collapse= "+"))) #回归表达式
newD = SMOTE(fml,data.train.normalize,k = 3,perc.over = 200,perc.under = 100)
运行结果:
> table(data.train.normalize$Y) # 违约样本占比约为0.2207143
0 1
16365 4635
> #fml = as.formula(paste("Y ~ ", paste("X",1:23, sep = "",collapse= "+"))) #回归表达式
> newD = SMOTE(fml,data.train.normalize,k = 3,perc.over = 200,perc.under = 100)
Error in T[i, ] : subscript out of bounds
In addition: There were 46 warnings (use warnings() to see them)
先对21000条的非均衡训练集样本进行重抽样,用的是SMOTE方法,希望能够将少数类样本(Y=1)合成2倍(perc.over /100)数量的新少数类样本,以此达到均衡样本。这是SMOTE函数主要工作。
但是现在遇到了这个错误,求问如何解决??有没有大神告知一下~~
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
落陷的阳光
2018-4-25 17:49:16
已解决。。。。。。。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
dangluzhuo
2018-4-26 18:43:31
请问如何解决的,我也碰到一样的问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
落陷的阳光
2018-4-27 11:06:39
dangluzhuo 发表于 2018-4-26 18:43
请问如何解决的,我也碰到一样的问题
把目标变量转换为因子变量,代码如下:
data.train.normalize$Y = factor(data.train.normalize$Y)
不谢~
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
用remote SAS出现问题
r软件中smote分析法
用R做SMOTE时总是出现下表出界
非平衡数据smote算法原理
R语言随机森林的权重惩罚/代价学习/smote抽样
基于平衡策略的SMO改进算法
SMOTE和Biased-SVM相结合的不平衡数据分类方法
SMOTE
请求smote算法sas代码。
使用SMOTE技术克服班级失衡
栏目导航
R语言论坛
经管文库
stata专版
行业分析报告
文献求助专区
数据交流中心
热门文章
文本分析:从经管顶刊“加分项”到学术发表 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CAIE人工智能工程师认证
CDA 数据分析师:线性回归实战指南 —— 从 ...
2025中国播客行业现状与发展趋势报告
2025年三季度中国消费者消费意愿调查报告
十五五规划建议思维导图
【详细整理,24重磅!】1990-2024上市公司市场 ...
“十五五”规划建议稿解读:乘势而上,因势 ...
奇瑞首夺J.D.Power-VDS自主冠军
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群