OpenVINO异步Stable Diffusion推理优化方案

本文介绍: 预测推理性能很困难，需要进行直接测量实验，才能找到最佳执行参数。我们在此次大赛的硬件支持下和开发范围内进行了多次的性能测试，来确保验证应用的整体（端到端）性能。针对于不同的参数和优化逻辑，设备的表现根据批次大小而异。总结任务最佳批次大小取决于模型、推理精度等因素。同样在某些情况下，可能需要将流和批处理结合起来才能尽力提高吞吐量。还有一种可能的吞吐量优化策略是设置延迟上限，然后增加批次大小和/或流数，直到出现长尾延迟问题（即吞吐量不再增加）为止。这个我们会在之后对模型的推理优化继续深究。

在这里插入图片描述

2022年，Stable Di ffus ion 模型横空出世，其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一，并为工业界，投资界，学术界以及竞赛界都注入了新的AI想象空间，让AI再次性感。

Stable Di ffusion是计算机视觉领域的一个生成式大模型，能够进行文生图（txt2img）和图生图（img2img）等图像生成任务。与Midjourn e y 不同的是，Stable Di ffusion是一个完全开源的项目（模型，代码，训练数据，论文等），这使得其快速构建了强大繁荣的上下游生态（AI绘画社区，基于SD的自训练模型，丰富的辅助AI绘画工具与插件等），并且吸引了越来越多的AI绘画爱好者也加入其中，与AI行业从业者一起不断推动AIGC行业的发展与普惠。

也正是Stable Di ffusion的开源属性，繁荣的上下游生态以及各行各业AI绘画爱好者的参与，使得AI绘画火爆出圈，让大部分人都能非常容易地进行AI绘画。可以说，本次AI科技浪潮的ToC普惠在AIGC时代的早期就已经显现，这是之前的传统深度学习时代从未有过的。而这也是最让Roc k y振奋的AIGC属性，让Roc k y相信未来的十年会是像移动互联网时代那样，充满科技变革与机会的时代。

Stable Diffusion 本质是基于扩散模型的高质量图像生成技术，可根据文本输入生成图像，广泛应用于CG、插画和高分辨率壁纸等领域。然而，由于其计算过程较为复杂，Stable Diffusi on 的图像生成速度常常成为遏制其发展的限制因素。

infer_request = compiled_model.create_infer_request()

同步实现方式伪代码	异步实现方式伪代码
创建一个负责处理当前文生图的推理请求即可… …While True:文生图预处理调用 infer()，以阻塞方式启动推理计算对推理结果做后处理显示推理结果，生成图片结果	创建一个推理请求负责处理当前文生图请求创建一个推理请求负责处理下一请求模块… …采集当前图像关键字对当前图像做预处理调用start_async()，以非阻塞方式启动当前模型推理计算While True：采集下一次对下一步模型推算做预处理调用start_async()，以非阻塞方式启动下一帧推理计算调用wait()，等待当前请求推理计算结束对当前推理结果做后处理交换当前推理请求和下一帧推理请求

# 创建一个负责处理当前文生图的推理请求
def process_inference_request(image):
    # 文生图预处理
    processed_image = preprocess_image(image)
    
    # 调用infer()，以阻塞方式启动推理计算
    inference_result = infer(processed_image)
    
    # 对推理结果做后处理
    postprocessed_result = postprocess_result(inference_result)
    
    # 显示推理结果，生成图片结果
    show_result(postprocessed_result)

# 创建一个推理请求类，负责处理当前文生图请求
class InferenceRequest:
    def __init__(self, image):
        self.image = image
        self.result = None
    
    def process(self):
        # 对当前文生图做预处理，调用start_async()，以非阻塞方式启动当前模型推理计算
        processed_image = preprocess_image(self.image)
        start_async_inference(processed_image, self)

# 创建一个推理请求队列
inference_queue = []

# 创建一个推理请求负责处理下一请求模块
class NextInferenceRequest:
    def __init__(self):
        self.next_image = None
    
    def process(self):
        # 采集下一次文生图
        self.next_image = capture_image()
        
        # 创建一个推理请求，并加入推理请求队列
        inference_request = InferenceRequest(self.next_image)
        inference_queue.append(inference_request)
        
        # 对下一次模型推算做预处理，调用start_async()，以非阻塞方式启动下一帧推理计算
        processed_image = preprocess_image(self.next_image)
        start_async_inference(processed_image, inference_request)

# 创建一个下一请求模块
next_request = NextInferenceRequest()

import numpy as np
import oneflow as flow
import oneflow.typing as tp

BATCH_SIZE = 100

def mlp(data):
  #构建网络...


@flow.global_function(type="train")
def train_job(
    images: tp.Numpy.Placeholder((BATCH_SIZE, 1, 28, 28), dtype=flow.float),
    labels: tp.Numpy.Placeholder((BATCH_SIZE,), dtype=flow.int32),
) -> tp.Numpy:
  #作业函数实现...
  #配置训练优化方法和参数


if __name__ == '__main__':
  #调用作业函数，开始训练...
      loss = train_job(images, labels)
  #...

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

优化异步推理

文章 目录

Stable Di ffus ion 推理 优化

背景

技术 讲解：

异步优化方案 思路：

异步推理优化原理

OpenVINO异步推理Py th on API

同步和异步实现 方式对比

oneflow 分布式 调度优化

优势：

实现思路

总结：

发表回复取消回复

Stable Diffusion 推理优化

技术讲解：

异步优化方案思路：

异步推理优化原理

OpenVINO异步推理Python API

同步和异步实现方式对比

oneflow分布式调度优化

优势：

实现思路

总结：

相关文章

发表回复 取消回复

Stable Di ffus ion 推理优化

OpenVINO异步推理Py th on API

oneflow 分布式调度优化

发表回复取消回复