全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
49 0
2025-10-17

Big-Math 强化学习数学数据集



Big-Math 是一个大规模、高质量的数学数据集,专为强化学习 (Reinforcement Learning, RL) 在语言模型中的应用而设计。该数据集由斯坦福大学和 SynthLabs 的研究人员于 2025 年发布,相关论文成果为「Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models」。


数据集特点

Big-Math 包含超过 250k 个高质量数学问题,每个问题都配有可验证的答案。数据集中的问题满足 3 个关键标准:


唯一可验证的解决方案:每个问题都有唯一的正确答案。


封闭形式的解:问题有明确的解法每个问题都配有可验证的答案。


开放式问题:问题表述开放,允许多种解题方法。



附件列表

Big-Math 强化学习数学数据集

大小:85 Bytes

只需: RMB 20 元  马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群