VCR 全称 Visual Commonsense Reasoning,是一个用于视觉常识推理的大规模数据集。该数据集提出了关于图像的具有挑战性的问题,机器需要完成两个子任务:正确回答问题以及提供理由证明其答案的合理性。
VCR 数据集包含大量问题,其中 212K 个用于训练,26K 个用于验证,25K 个用于测试。答案和理由来自超过 110K 个不重复的电影场景。
VCR.rar
大小:276.56 KB
只需: 501 个论坛币 马上下载
磁力链接27.55G
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝