全部版块 我的主页
论坛 数据科学与人工智能 人工智能 自然语言处理
140 0
2025-11-26

Llama Nemotron VLM v1 是由英伟达于 2025 年发布用于 VLM 后训练的高质量图文数据集,用于支持英伟达发布的 Llama-3.1-Nemotron-Nano-VL-8B-V1 文档理解模型(支持文档问答、图表问答、 AI2D 等场景)。

该数据集整体规模 为 21 个子集,包含 2,863,854 条样本。数据覆盖 VQA(视觉问答)、 Captioning(图像描述)和 OCR(文本识别)三大类别,包含重新标注的公开图像数据集、全/半合成的 OCR 数据(中/英文,字符/词/页面级)以及内部标注的 OCR 集,并对原始 QA(问答)或描述进行了细化与增强,适用于智能体、聊天助手、 RAG 等应用的多模态训练与评测。

附件列表

Llama-Nemotron-VLM-Dataset-v1.rar

大小:982.04 KB

只需: 301 个论坛币  马上下载

磁力链接,90.89G

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群