yolov5检测(前向)输入视频输出(不在图上画标签形式的原)图片的方法，及设置每隔几帧保存的方式(不每帧保存减少重复)

本文介绍: yolov5检测(前向)输入视频输出(不在图上画标签形式的原)图片的方法，及设置每隔几帧保存的方式(不每帧保存减少重复)

这个流程可能会有几处有些障碍，一个是模型检测生成的label的yolo格式数据转化成labelme格式的数据以及调整好之后labelme格式的数据再转回yolo训练格式的数据，这个问题的解决及对应的代码写在我之前的文章中；另一个就是yolov5输入的是视频时输出的也同样是个视频，且是带有检测结果的视频(带有实时检测框的视频)，如图：
在这里插入图片描述

而我们想要的是原图进行训练，保存的是原图及对应的label。解决方法如下：
在detect.py代码里的Proc ess predictions中添加如下两行的代码：

e_save = os.path.splitext(save_path)[0] + f'_{frame}' + '.jpg'
cv2.imwrite(e_save, im0)

在这里插入图片描述
运行结果如图：

图片命名格式输入视频的名称后面加上帧数。

在这里插入图片描述
detect.py中前向推理部分的代码结构大概是这样的：

for path, img, im0s, vid_cap in dataset:
    # ... 一些前期的代码 ...

    # 运行检测
    img = torch.from_numpy(img).to(device)
    img = img.float()  # uint8 to fp16/32
    img /= 255.0  # 0 - 255 to 0.0 - 1.0
    if img.ndimension() == 3:
        img = img.unsqueeze(0)

    # ... 一些中间的代码，可能有模型推理的部分 ...

    # 后处理
    # ...

    # 在这里添加代码，确保只在每25帧执行检测
    if vid_path:
        current_frame += 1
        if current_frame % 25 == 0:
            # 执行你的检测代码
            # ...

# ... 一些后期的代码 ...