全部版块 我的主页
论坛 数据科学与人工智能 人工智能 机器学习
95 0
2025-11-21

OmniSpatial 是由清华大学联合上海期智研究院、上海人工智能实验室等机构于 2025 年发布的一个全景空间推理基准数据集,相关论文成果为「OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models」,旨在填补视觉 – 语言模型空间理解评测的空白。

该数据集包含约 1,533 个图像 – 问答样本,涵盖动态推理(Dynamic Reasoning)、复杂空间逻辑(Complex Spatial Logic)、空间交互(Spatial Interaction)和视角转换(Perspective Taking)四大类空间推理任务,共计 50 个子任务。数据来源多样,涵盖互联网图像、心理学测试与驾驶考试题,标注经多轮审核,保证质量与多样性。与传统基准相比,OmniSpatial 避免了模板化构造,更贴近真实复杂场景,不仅测试基础空间关系(如前后、左右、远近),还强调多物体交互、场景变化和跨视角推理。

该数据集适用于训练与评测多模态大模型的空间推理能力,特别是在智能导航、增强/虚拟现实以及复杂场景理解等应用中,是一个全面而具有挑战性的标准化基准数据集。

附件列表

OmniSpatial.rar

大小:95.49 KB

只需: 201 个论坛币  马上下载

磁力链接,9.45G

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群