开放词汇视觉定位 OV-VG: A Benchmark for Open-Vocabulary Visual Grounding 论文笔记

互联网 1 年前 0 9

本文介绍: 开放词汇检测旨在检测那些未出现在预定词汇中的目标，类似的任务有视觉定位 Visual Ground in g (VG)。然而当前的基础模型虽然在很多视觉语言任务上表现很好，但是在开放视觉定位 open–voc a bulary visual grounding (OV-VG) 上还没有拿得出手的工作。

1j∈Oi+∑−log(∑k=0N−1exp(tiTok/τ)exp(tiToj/τ))其中

τ

tau

$τ$ 为温度参数，整体损失为：

L

=

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

grounding vg visual

相关文章

Windos 下 VScode + Visual Studio 编译器编译工程

Windos 下 VScode + Visual Studio 编译器编译工程

互联网 1 年前 2

什么是IDE？新手用哪个IDE比较好？

什么是IDE？新手用哪个IDE比较好？

互联网 1 年前 6

C语言通过MSXML6.0读写XML文件（同时支持char[]和wchar_t[]字符数组）

C语言通过MSXML6.0读写XML文件（同时支持char[]和wchar_t[]字符数组）

互联网 1 年前 4

LLVM系列（1）：在微软Visual Studio下编译LLVM

LLVM系列（1）：在微软Visual Studio下编译LLVM

互联网 1 年前 6

18款Visual Studio实用插件（更新）

18款Visual Studio实用插件（更新）

互联网 1 年前 3

【微软技术栈】与其他.NET语言的互操作性 (C++/CLI)

【微软技术栈】与其他.NET语言的互操作性 (C++/CLI)

互联网 1 年前 13

JVM之GC垃圾回收

互联网 1 年前 3

行为型设计模式—中介者模式

互联网 1 年前 4

发表回复取消回复