Image Super-Resolution with Text Prompt Diffusion

互联网 1 年前 0 4

本文介绍: 受多模态方法和文本提示图像处理进步的启发，我们将文本提示引入图像SR，以提供退化先验。具体来说，我们首先设计了一个文本图像生成管道，通过文本退化表示和退化模型将文本集成到SR数据集中。文本表示采用基于装箱方法的离散化方式来抽象描述退化。这种表示方法还可以保持语言的灵活性。同时，我们提出了Pro mp tSR来实现文本提示SR。Pr o mp tSR采用了扩散模型和预先训练的语言模型（例如T5和CLIP）。我们在生成的文本图像数据集上训练模型。

Im a g e Super-Res olut ion wi th Text Pr o mp t Di ffus ion (Pa per read in g)

Zheng Chen, Shangh ai Ji a o Tong Uni v e r sity, arXi v23, Code, Paper

1. 前言

受多模态方法和文本提示图像处理进步的启发，我们将文本提示引入图像SR，以提供退化先验。具体来说，我们首先设计了一个文本图像生成管道，通过文本退化表示和退化模型将文本集成到SR数据集中。文本表示采用基于装箱方法的离散化方式来抽象描述退化。这种表示方法还可以保持语言的灵活性。同时，我们提出了Pr o mptSR来实现文本提示SR。Pr o mptSR采用了扩散模型和预先训练的语言模型（例如T5和CLIP）。我们在生成的文本图像数据集上训练模型。

2. 整体思想

在这里插入图片描述

快速水一篇文章！没什么insig ht。如上图，这篇文章就是SR3+prompt或者说完全等于Stable Diffuison。数据集就是下面这么构建的：

在这里插入图片描述

好像没有别的要说的了。。。。不如看看这两篇文章1）AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion；2）CONTROLLING VISION-LANGUAGE MODELS FOR MULTI-TASK IMAGE RESTORATION

3. 实验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

·消融实验，图4在给出[轻微噪声]这个 prompt时，不能有效去除噪声，给出错误的[unchange]这个 prompt时，会引入伪影。还做了不同文本编码器的影响，我觉得没必要吧。因为你这个 text prompt换成1，2，3，4没准也wo rk？

在这里插入图片描述

原文地址:https://blog.csdn.net/qq _43800752/article/de tail s/134697257

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_33528.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

sr 文本退化

相关文章

vue2.0+使用md-edit编辑器

vue2.0+使用md-edit编辑器

vue 11 月前 4

【自然语言处理】P3 spaCy 与 NLTK（分词、词形还原与词干提取）以及 Porter 和 Snowball

【自然语言处理】P3 spaCy 与 NLTK（分词、词形还原与词干提取）以及 Porter 和 Snowball

互联网 11 月前 7

python-自动化篇-运维-语音识别

python-自动化篇-运维-语音识别

python 11 月前 3

vim 编辑器查找和替换文本命令

vim 编辑器查找和替换文本命令

互联网 11 月前 4

webpack源码分析——truncateArgs函数

webpack源码分析——truncateArgs函数

互联网 11 月前 4

Transformer 自然语言处理（二）

Transformer 自然语言处理（二）

互联网 11 月前 11

JVM之GC垃圾回收

互联网 11 月前 3

行为型设计模式—中介者模式

互联网 11 月前 4

发表回复取消回复