全部版块 我的主页
论坛 数据科学与人工智能 人工智能 深度学习
215 0
2025-11-26

Nemotron-Pretraining-Dataset-sample 是英伟达于 2025 年发布的 Nemotron 预训练数据集的精简采样版本,相关论文成果为「NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model」。

该数据集包含从完整的 SFT 与预训练语料的不同组成部分中选取的 10 个代表性子集,内容涵盖高质量问答数据、专注于数学领域的提取内容、代码元数据及 SFT 风格指令数据,适用于检阅和快速实验。

附件列表

Nemotron-Pretraining-Dataset-sample.rar

大小:1.48 KB

只需: 101 个论坛币  马上下载

磁力链接,79.87M

本附件包括:

  • Nemotron-Pretraining-Dataset-sample.torrent

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群