OST-Bench 时空场景理解基准数据集

105

收藏 2025-12-29

OST-Bench 是由上海人工智能实验室联合上海交通大学、香港大学等机构于 2025 年发布的，用于评估多模态大模型在线时空场景理解能力的数据集，相关论文成果为「OST-Bench: Evaluating the Capabilities of MLLMs in Online Spatio-temporal Scene Understanding」，旨在用于评测多模态大模型在在线场景探索、可见信息建模与时空推理任务中的综合理解能力。

该数据集共选取约 1,400 个真实室内三维场景，并基于场景探索过程生成约 10,000 条多轮时序问答样本。场景来源于 ScanNet 、 ARKitScenes 与 Matterport3D，并基于统一的三维物体与语义标注进行处理；在每个场景中构建连续视角探索轨迹，并根据累积可见信息生成对应问答内容。任务设计覆盖三大核心理解方向，包括代理状态、可见信息与代理–物体空间关系，共细化为 15 种子任务，以多轮对话形式呈现，要求模型根据历史观测与当前视野进行在线时空推理。

附件列表

OST-Bench.rar

大小:256.88 KB

只需: 301 个论坛币马上下载

磁力链接，25.58G

本附件包括：

OST-Bench.torrent

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群