Referlt3D 数据集适用于 3D visual grounding 及 3D dense captioning 任务,包括 2 个大规模 visio-linguistic 互补的数据集:
Sr3D 数据集:包含 83.5K 基于模板的句子,利用细粒度对象类之间的空间关系,定位场景中引用的对象;
Nr3D 数据集:包括 41.5K 自然发生、形式不限的句子,这些句子是通过在 3D 场景中部署一个 2 人游戏收集的 。
Referlt3D.rar
大小:1.47 KB
只需: 101 个论坛币 马上下载
磁力链接76.91M
本附件包括:
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝