经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
R 重抽样SMOTE函数出现“ subscript out of bounds”错误
楼主
落陷的阳光
10518
3
收藏
2018-04-25
程序代码:
table(data.train.normalize$Y) # 违约样本占比约为0.2207143
fml = as.formula(paste("Y ~ ", paste("X",1:23, sep = "",collapse= "+"))) #回归表达式
newD = SMOTE(fml,data.train.normalize,k = 3,perc.over = 200,perc.under = 100)
运行结果:
> table(data.train.normalize$Y) # 违约样本占比约为0.2207143
0 1
16365 4635
> #fml = as.formula(paste("Y ~ ", paste("X",1:23, sep = "",collapse= "+"))) #回归表达式
> newD = SMOTE(fml,data.train.normalize,k = 3,perc.over = 200,perc.under = 100)
Error in T[i, ] : subscript out of bounds
In addition: There were 46 warnings (use warnings() to see them)
先对21000条的非均衡训练集样本进行重抽样,用的是SMOTE方法,希望能够将少数类样本(Y=1)合成2倍(perc.over /100)数量的新少数类样本,以此达到均衡样本。这是SMOTE函数主要工作。
但是现在遇到了这个错误,求问如何解决??有没有大神告知一下~~
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
落陷的阳光
2018-4-25 17:49:16
已解决。。。。。。。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
dangluzhuo
2018-4-26 18:43:31
请问如何解决的,我也碰到一样的问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
落陷的阳光
2018-4-27 11:06:39
dangluzhuo 发表于 2018-4-26 18:43
请问如何解决的,我也碰到一样的问题
把目标变量转换为因子变量,代码如下:
data.train.normalize$Y = factor(data.train.normalize$Y)
不谢~
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
用remote SAS出现问题
r软件中smote分析法
用R做SMOTE时总是出现下表出界
非平衡数据smote算法原理
R语言随机森林的权重惩罚/代价学习/smote抽样
基于平衡策略的SMO改进算法
SMOTE和Biased-SVM相结合的不平衡数据分类方法
SMOTE
请求smote算法sas代码。
使用SMOTE技术克服班级失衡
栏目导航
R语言论坛
微观经济学
休闲灌水
EViews专版
求助成功区
金融实务版
热门文章
我该如何记住你?智能体记忆系统的演化之路
CDA数据分析脱产就业班于2026年3月7日开班! ...
无上高明的“无为”“无住”哲学在传统中国
新宏观丨中美经济总量差距拉大的根源
艾瑞咨询 - 2025年中国早教行业白皮书
第一太平戴维斯 - 2026年中国房地产市场展望 ...
2025中国居民退休准备指数调研报告-清华大学 ...
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
精准匹配,菁英相伴--经管之家单身俱乐部, ...
CDA数据分析师:商业数据分析实践的核心执行 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群