经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
数据挖掘中训练集和测试集的比例多少比较合适
楼主
xiaocaibaozi
19139
1
收藏
2013-07-24
我总体的数据有7473个,是非平衡数据集,随机抽取测试集的时候,我抽取了2491个,也就是大概1/3,可是我觉得抽取的数量有些太多了,想问下对于这个数据集什么样的比例比较合适,单个的训练集的数目应该多少,是不是还要采用欠采样来保证数据预测的平衡性?求解答
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
kuangsir6
2013-7-24 13:48:12
根据我们的一次模拟,你抽的这个数字应该是比较恰当的。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助]关于数据挖掘的问题
100多篇数据挖掘方面论文
数据挖掘共享群招人
数据挖掘交流群111544968精英招募ing
训练集的建模结果还不如验证集和测试集?
SAS提取训练集和测试集
数据挖掘训练集与测试集采用不同规则分区的研究
发现数据挖掘是一个迭代的过程,是一个探索的过程
如何能够更方面地对训练集和测试集进行数据离散化
数据挖掘中易犯的十大错误
栏目导航
数据分析与数据挖掘
微观经济学
经管文库(原现金交易版)
爱问频道
经管高考
经管在职研
热门文章
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
在概率与代码之间:Agent Skills 是 AI 的枷 ...
失去的三十年:平成日本经济史(【日】野口 ...
求:Multiple Time Scale Dynamics
2026 AI赋能文化产业发展报告-AI创意业态透 ...
表格结构数据特征与CDA数据分析师:精准适配 ...
问卷填写,每份50个论坛币
新宏观丨豆包,传统经济学与商学对全球性债 ...
新宏观丨豆包,谁是传统经济学的最大反对派
硅光芯片代工爆发式增长,重构全球半导体产 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群