Unifying Vision-Language Representation Space with Single-tower Transformer

收藏 2025-09-01

Unifying Vision-Language Representation Space
                                 with Single-tower Transformer
                     Jiho Jang1    Chaerin Kong1       Donghyeon Jeon2 Seonhoon Kim3    Nojun Kwak1
                                 1                2       3
                                 Seoul National University    NAVER    Coupang
arXiv:2211.11153v1 [cs.LG] 21 Nov 2022

                  Figure 1: A truly unified vision-language representation s ...

附件列表

Unifying Vision-Language Representation Space with Single-tower Transformer.pdf

大小:2.96 MB

只需: RMB 6 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群