经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
数据挖掘中训练集和测试集的比例多少比较合适
楼主
xiaocaibaozi
19144
1
收藏
2013-07-24
我总体的数据有7473个,是非平衡数据集,随机抽取测试集的时候,我抽取了2491个,也就是大概1/3,可是我觉得抽取的数量有些太多了,想问下对于这个数据集什么样的比例比较合适,单个的训练集的数目应该多少,是不是还要采用欠采样来保证数据预测的平衡性?求解答
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
kuangsir6
2013-7-24 13:48:12
根据我们的一次模拟,你抽的这个数字应该是比较恰当的。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助]关于数据挖掘的问题
100多篇数据挖掘方面论文
数据挖掘共享群招人
数据挖掘交流群111544968精英招募ing
训练集的建模结果还不如验证集和测试集?
SAS提取训练集和测试集
数据挖掘训练集与测试集采用不同规则分区的研究
发现数据挖掘是一个迭代的过程,是一个探索的过程
如何能够更方面地对训练集和测试集进行数据离散化
数据挖掘中易犯的十大错误
栏目导航
数据分析与数据挖掘
经管高考
CFA、CVA、FRM等金融考证论坛
求助成功区
经管文库(原现金交易版)
stata专版
热门文章
国家新纪元:人工智能时代的力量与优势
大势与抉择:关键趋势20讲(马江博)
CDA数据分析脱产就业班于2026年3月7日开班! ...
参数估计:CDA数据分析师的核心推断工具,用 ...
通用指标与场景指标:CDA数据分析师的核心分 ...
GeoSaaS永久会员版
全国国土利用现状、耕地、园地、林地分布等 ...
2024年合集 ESG评级数据大全(彭博 华证 Wi ...
脑机接口行业系列报告:Neuralink带来的启示 ...
技术趋势2026
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群