经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
数据挖掘中训练集和测试集的比例多少比较合适
楼主
xiaocaibaozi
18995
1
收藏
2013-07-24
我总体的数据有7473个,是非平衡数据集,随机抽取测试集的时候,我抽取了2491个,也就是大概1/3,可是我觉得抽取的数量有些太多了,想问下对于这个数据集什么样的比例比较合适,单个的训练集的数目应该多少,是不是还要采用欠采样来保证数据预测的平衡性?求解答
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
kuangsir6
2013-7-24 13:48:12
根据我们的一次模拟,你抽的这个数字应该是比较恰当的。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助]关于数据挖掘的问题
100多篇数据挖掘方面论文
数据挖掘共享群招人
数据挖掘交流群111544968精英招募ing
训练集的建模结果还不如验证集和测试集?
SAS提取训练集和测试集
数据挖掘训练集与测试集采用不同规则分区的研究
发现数据挖掘是一个迭代的过程,是一个探索的过程
如何能够更方面地对训练集和测试集进行数据离散化
数据挖掘中易犯的十大错误
栏目导航
数据分析与数据挖掘
经管高考
Stata专版
休闲灌水
行业分析报告
计量经济学与统计软件
热门文章
CDA考试模拟题库:新增章节练习题(更新于1 ...
【AI Agent可靠性】 智能体Agent记忆系统: ...
全球数字经贸规则年度观察报告(2025年)
2025骑行配件出海研究报告
股市操练大全PDF版
25秋投资学回忆
2025重塑人工智能时代的绩效管理报告-美世
2025年中国商业地产行业市场洞察报告
达富发投资关于萃华珠宝行情机构数据分析及 ...
【课程课件】南开大学《高等数学》课件
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群