全部版块 我的主页
论坛 数据科学与人工智能 人工智能 深度学习
290 0
2025-11-27

Document Haystack 是由 Amazon AGI 于 2025 年发布的一个多模态文档基准数据集,相关论文成果为「Document Haystack: A Long Context Multimodal Image/Document Understanding Vision LLM Benchmark」,旨在评估视觉语言模型(VLM)在长上下文复杂文档中的信息检索与理解能力。

该数据集包含 400 份文档变体和 8,250 个检索问题,涵盖了 5-200 页篇幅的真实文档,数据形式包括原始 PDF 、 200 DPI 分页图像和纯文本解析文件,适用于问答(Question-Answering)和视觉问答(Visual Question-Answering)等任务。

附件列表

document-haystack.rar

大小:147.11 KB

只需: 201 个论坛币  马上下载

磁力链接,14.6G

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群