SAM：基于 prompt 的通用图像分割模型

互联网 1 年前 0 1

本文介绍: SAM：基于 prompt 的通用图像分割模型Segment anything

SAM 是 Meta AI 开发的一款基于 prompt 的通用视觉大模型，能够 zero-shot 识别并分割给定图像中任意类型的目标，并且能够迁移到其他任务中。SAM 的动机是为了建立一个通用的图像分割基础模型，类似于 NLP 领域的 GPT-3，可以在不需要额外训练的情况下，适应各种下游任务和数据集。

在这里插入图片描述

本文不再按照论文解读的方式逐段记录，只专注于介绍 SAM 技术本身，参考五分钟看明白分割一切模型 SAM。

SAM 模型的目标是实现图像的交互式分割，即根据用户提供的 prompt 来划分图像中的不同对象或区域。但想要根据用户 prompt 分割图像是一个复杂的问题，因为 prompt 可能不完整、不清晰、甚至不准确，图像中的对象或区域也可能是多样、复杂、模糊或重叠的。

为了能够理解图像内容和用户意图，SAM 使用基于 transformer 的视觉模型，可以在不需要任何标注的情况下，对任意图像进行分割。它的输入包括一个图像和 prompt，prompt 可以是点、框、文本或者掩码，用来指示要分割的目标；输出是一个分割掩码，表示图像中每个像素属于前景或背景的概率。
在这里插入图片描述

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

anything sam segment

相关文章

【论文阅读笔记】Sam3d: Segment anything model in volumetric medical images[

【论文阅读笔记】Sam3d: Segment anything model in volumetric medical images[

互联网 1 年前 0

封装了一个顺滑嵌套滚动的框架

互联网 1 年前 4

零基础上手，秒识别检测，IDEA研究院发布全新T-Rex模型

零基础上手，秒识别检测，IDEA研究院发布全新T-Rex模型

互联网 1 年前 3

GPT5大剧第二季开启，Sam Altman 重掌 OpenAI CEO 大权

GPT5大剧第二季开启，Sam Altman 重掌 OpenAI CEO 大权

互联网 1 年前 3

Segment Anything（SAM）的demo的简单使用

互联网 1 年前 1

实验 elk+filebeat+kafka

实验 elk+filebeat+kafka

互联网 1 年前 2

JVM之GC垃圾回收

互联网 1 年前 4

行为型设计模式—中介者模式

互联网 1 年前 5

发表回复取消回复