全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
19 0
2026-02-26

LAION-SG 图像理解数据集 2024 大规模场景图 - 图像对 跨模态研究数据集下载



LAION-SG 大规模高质量图像理解数据集是 2024 年由浙江大学、江南大学、北京大学、阿里巴巴集团、蚂蚁集团联合构建的专业数据集,相关论文成果为「LAION-SG: An Enhanced Large-Scale Dataset for Training Complex Image-Text Models with Structural Annotations」,是适配复杂图文模型训练的优质结构注释数据集。



LAION-SG 图像理解数据集包含540,005 个带对象、属性和关系注释的场景图 - 图像对,所有数据严格划分为训练集、验证集、测试集,数据集图像源为 LAION-Aesthetics V2 (6.5+) 数据集,注释环节通过 GPT-4o 实现自动化注释,保障注释的精准性与高效性。



相较于原始 LAION-Aesthetics 数据集,LAION-SG 大规模数据集的平均注释长度、注释准确性均大幅提升,样本平均包含 6.39 个对象,对象信息直接增加 20%;若排除抽象专有名词,对象信息优势提升至 216%,数据丰富度与实用性显著增强。



LAION-SG 数据集内容覆盖

基础数据:540,005 个场景图 - 图像对,含完整的对象、属性、关系结构化注释;

数据划分:标准训练集、验证集、测试集,满足模型训练全流程使用;

注释信息:GPT-4o 自动化标注的精准语义信息,覆盖多场景对象关联与属性描述。



LAION-SG 数据集可用途径

LAION-SG 图像理解数据集适用于图像与文本跨模态研究全领域,核心应用场景包含:

图像描述生成模型的训练与优化;

视觉问答系统(VQA)的研发与测试;

图像检索任务的算法验证与模型训练;

各类复杂图像 - 文本跨模态模型的结构化训练,助力图像内容的深入理解与语义解析。




c95d47d8-25e3-43e0-aee7-2968b7236dd5.png






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群