图像处理之《可逆重缩放网络及其扩展》论文精读

本文介绍: 图像重缩放是一种常用的双向操作，它首先将高分辨率图像缩小以适应各种显示器或存储和带宽友好，然后将相应的低分辨率图像放大以恢复原始分辨率或放大图像中的细节。然而，非单射下采样映射丢弃了高频内容，导致逆恢复任务存在不适定问题。这可以抽象为具有信息损失的一般图像退化-恢复问题。在这项工作中，我们提出了一个新的可逆框架来处理这一普遍问题，该框架从一个新的角度来模拟双向退化和恢复，即可逆双射变换。该框架的可逆性使其能够以分布的形式对退化前的信息损失进行建模，从而缓解恢复后的不适定问题

一、文章摘要

图像重缩放是一种常用的双向操作，它首先将高分辨率图像缩小以适应各种显示器或存储和带宽友好，然后将相应的低分辨率图像放大以恢复原始分辨率或放大图像中的细节。然而，非单射下采样映射丢弃了高频内容，导致逆恢复任务存在不适定问题。这可以抽象为具有信息损失的一般图像退化-恢复问题。在这项工作中，我们提出了一个新的可逆框架来处理这一普遍问题，该框架从一个新的角度来模拟双向退化和恢复，即可逆双射变换。该框架的可逆性使其能够以分布的形式对退化前的信息损失进行建模，从而缓解恢复后的不适定问题。具体来说，我们开发了可逆模型来生成有效的退化图像，同时在正向退化过程中将丢失内容的分布转化为潜变量的固定分布。然后，通过对生成的退化图像与随机绘制的潜在变量应用逆变换，使恢复变得易于处理。我们从图像的重缩放开始，实例化模型为可逆的重缩放网络，可以很容易地扩展到类似的脱色-着色任务。我们进一步建议将可逆框架与现有的退化方法(如图像压缩)结合起来，以获得更广泛的应用。实验结果表明，与现有方法相比，我们的模型在从缩小和脱色图像进行放大和彩色重建的定量和定性评估以及图像压缩的速率失真方面都有显著改进。
在这里插入图片描述

二、文章提出的方法

2.1 图像重缩放模型

对于具体的模型，我们在这一节从图像重缩放开始。我们开发了可逆重缩放网络(IRN)作为我们图像重缩放可逆建模框架的实例化模型，并描述了IRN的具体可逆结构和训练方法。我们还在算法1,2中给出了IRN模型中的下采样和升尺度算法作为示例，以更好地演示我们的可逆框架的输入、输出和过程。注意，在实践中，HR图像x和LR图像y将被量化为8位表示，如3.3.1节所述。我们在算法描述中省略了这个细节，并将定义域视为R。
在这里插入图片描述

2.1.1 可逆结构

依赖关系和安装
（1）Python 3(推荐使用Anaconda)
（2）PyTorch >= 1.0
（3）NVIDIA GPU + CUDA
（4）Python包：pip install numpy opencv-python lmdb pyyaml
（5）TensorBoard:
PyTorch >= 1.1: pip install tb-nightly future
PyTorch == 1.0: pip install tensorboardX

图像缩放训练
首先在options/train/中设置一个配置文件，然后按如下方式运行：
python train.py -opt options/train/train_IRN_x4.yml

图像缩放测试
首先在options/test/中设置一个配置文件，然后按如下方式运行：
python test.py -opt options/test/test_IRN_x4.yml

图像脱色-着色训练
首先在options/train/中设置一个配置文件，然后按如下方式运行：
python train_IRN-Color.py -opt options/train/train_IRN_color.yml

图像脱色-着色测试
首先在options/test/中设置一个配置文件，然后按如下方式运行：
python test_IRN-Color.py -opt options/test/test_IRN_color.yml

结合图像压缩训练
首先在options/train/中设置一个配置文件，然后按如下方式运行：
python train_IRN-Compression.py -opt options/train/train_IRN-Compression_x2_q90.yml

结合图像压缩测试
首先在options/test/中设置一个配置文件，然后按如下方式运行：
python test_IRN-Compression.py -opt options/test/test_IRN-Compression_x2_q90.yml

代码框架
代码框架遵循BasicSR。它主要由配置、数据、模型和网络四部分组成。
让我们使用train命令python train.py -opt options/train/train_IRN_x4为例。在此命令之后将执行一系列操作。
（1）train.py被调用。
（2）读取选项/train/train_IRN_x4.yml中的配置，包括数据加载器的配置，网络，丢失，培训策略等。配置文件由options/options.py处理。
（3）创建训练和验证数据加载器。数据加载器是根据不同的数据模式在data/__init__.py中构造的。
（4）创建模型(根据不同的模型类型在models/__init__.py中构造)。
（5）开始训练模型。其他操作如日志记录、保存中间模型、验证、更新学习率等也在训练过程中完成。

（1）将codes目录设置为源代码根目录(pycharm)
（2）安装lmdb包：conda install -c conda-forge python-lmdb
（3）安装opencv包：conda install -c https://conda.anaconda.org/menpoopencv
（4）安装yaml包：conda install pyyaml
（5）安装tensorboardX包：conda install tensorboardX(pycharm)
（6）安装seaborn包：conda install seaborn(pycharm)

（1）切换目录：cd codes
（2）执行命令：python test.py -opt options/test/test_IRN_x4.yml(注意注释其余test)

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

图像恢复缩放

相关文章

发表回复 取消回复

发表回复取消回复