COREVQA 视觉问答基准数据集

382

收藏 2025-11-21

COREVQA 是由 Algoverse 人工智能研究中心于 2025 年发布的一个视觉问答基准数据集，相关论文成果为「COREVQA: A Crowd Observation and Reasoning Entailment Visual Question Answering Benchmark」，旨在评估视觉语言模型（VLM）在人群场景中的推理蕴含能力。

该数据集包含 5,608 对图像与真/假语句对，图像源自 CrowdHuman 数据集。数据以真实拥挤场景为主，强调遮挡、视角变化与背景干扰等难点，旨在推动 VLM 在复杂社会场景下的细粒度感知与推理能力。

附件列表

COREVQA.rar

大小:57.18 KB

只需: 201 个论坛币马上下载

磁力链接，5.63G

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群