经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
数据挖掘中训练集和测试集的比例多少比较合适
楼主
xiaocaibaozi
19199
1
收藏
2013-07-24
我总体的数据有7473个,是非平衡数据集,随机抽取测试集的时候,我抽取了2491个,也就是大概1/3,可是我觉得抽取的数量有些太多了,想问下对于这个数据集什么样的比例比较合适,单个的训练集的数目应该多少,是不是还要采用欠采样来保证数据预测的平衡性?求解答
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
kuangsir6
2013-7-24 13:48:12
根据我们的一次模拟,你抽的这个数字应该是比较恰当的。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助]关于数据挖掘的问题
100多篇数据挖掘方面论文
数据挖掘共享群招人
数据挖掘交流群111544968精英招募ing
训练集的建模结果还不如验证集和测试集?
SAS提取训练集和测试集
数据挖掘训练集与测试集采用不同规则分区的研究
发现数据挖掘是一个迭代的过程,是一个探索的过程
如何能够更方面地对训练集和测试集进行数据离散化
数据挖掘中易犯的十大错误
栏目导航
数据分析与数据挖掘
计量经济学与统计软件
学道会
金融实务版
经管文库(原现金交易版)
R语言论坛
热门文章
从“数字”到“数据”:CDA数据分析师视角下 ...
CAIE LEVEL Ⅰ考试更新说明(2026年4月)
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
2025-2026年度中国证券业运行形势分析与趋势 ...
2025-2026年度中国保险业运行形势分析与趋势 ...
我国金融机构的系统风险重要性研究——基于 ...
上海黄金是人民币汇率风险的对冲工具和安全 ...
OpenClaw+Claude Code丨从"手动科研"到 ...
从数据源头到商业洞察:CDA数据分析师视角下 ...
2026年3月宏观经济数据分析
推荐文章
五一充电,学术突围!四大AI赋能王牌课程, ...
关于学术研究和论文发表的一些建议
几种免费下载文献的方法----我的文献应助经
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群