改进Soft-nms的YOLO的手势识别＆石头剪刀布游戏AI对战系统(IoU,GIoU,DIoU,CIoU,EIoU,SIoU)

本文介绍: 改进So ft–n ms的YOLO的手势识别＆石头剪刀布游戏AI对战系统(IoU,GIoU,DIoU,CIoU,EIoU,SIoU)

项目参考 AAAI Association for the Advancement of Artificial Intelligence

随着人工智能技术的不断发展，手势识别和游戏AI对战系统已经成为了研究的热点领域。手势识别可以应用于人机交互、虚拟现实、智能家居等领域，而游戏AI对战系统则可以提供更具挑战性和趣味性的游戏体验。然而，目前的手势识别和游戏AI对战系统还存在一些问题，例如准确性不高、响应速度慢等。

在目标检测领域，YOLO（You Only Lo ok On ce）是一种常用的算法，它通过将目标检测任务转化为一个回归问题，实现了实时目标检测。然而，传统的YOLO算法在处理重叠目标时存在一些问题，例如对于密集目标的检测效果不佳，容易出现目标漏检和误检的情况。

为了解决这些问题，研究者们提出了一种改进的目标检测算法，即Sof t–n ms（Sof t Non-Maxi mum Sup pre ss ion）。Sof t–n ms 通过降低重叠目标的置信度来抑制重叠目标的检测，从而提高了目标检测的准确性。然而，传统的Sof t–n ms算法仍然存在一些局限性，例如对于小目标的检测效果不佳，容易出现目标漏检的情况。

因此，本研究旨在改进Soft-n ms算法，以提高手势识别和游戏AI对战系统的准确性和响应速度。具体而言，我们将引入一系列新的IoU（Inte r section over Unio n）计算方法，包括GIoU（Gene r ali zed IoU）、DIoU（Di stance IoU）、CIoU（Comp let e IoU）、EIoU（Enhance d IoU）、SIoU（Soft IoU）等。这些新的IoU计算方法可以更准确地衡量目标之间的重叠程度，从而更好地抑制重叠目标的检测。

import os
import shutil
import random

# 指定输入和输出文件夹的路径
input_dir = 'train'
output_dir = 'output'

# 确保输出文件夹存在
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# 遍历输入文件夹中的所有子文件夹
for subdir in os.listdir(input_dir):
    input_subdir_path = os.path.join(input_dir, subdir)

    # 确保它是一个子文件夹
    if os.path.isdir(input_subdir_path):
        output_subdir_path = os.path.join(output_dir, subdir)

        # 在输出文件夹中创建同名的子文件夹
        if not os.path.exists(output_subdir_path):
            os.makedirs(output_subdir_path)

        # 获取所有文件的列表
        files = [f for f in os.listdir(input_subdir_path) if os.path.isfile(os.path.join(input_subdir_path, f))]

        # 随机选择四分之一的文件
        files_to_move = random.sample(files, len(files) // 4)

        # 移动文件
        for file_to_move in files_to_move:
            src_path = os.path.join(input_subdir_path, file_to_move)
            dest_path = os.path.join(output_subdir_path, file_to_move)
            shutil.move(src_path, dest_path)

print("任务完成！")

-----dataset
	-----dataset
           |-----train
           |   |-----class1
           |   |-----class2
           |   |-----.......
           |
           |-----valid
           |   |-----class1
           |   |-----class2
           |   |-----.......
           |
           |-----test
           |   |-----class1
           |   |-----class2
           |   |-----.......

 Epoch   gpu_mem       box       obj       cls    labels  img_size
 1/200     20.8G   0.01576   0.01955  0.007536        22      1280: 100%|██████████| 849/849 [14:42<00:00,  1.04s/it]
           Class     Images     Labels          P          R     mAP@.5 mAP@.5:.95: 100%|██████████| 213/213 [01:14<00:00,  2.87it/s]
             all       3395      17314      0.994      0.957      0.0957      0.0843

 Epoch   gpu_mem       box       obj       cls    labels  img_size
 2/200     20.8G   0.01578   0.01923  0.007006        22      1280: 100%|██████████| 849/849 [14:44<00:00,  1.04s/it]
           Class     Images     Labels          P          R     mAP@.5 mAP@.5:.95: 100%|██████████| 213/213 [01:12<00:00,  2.95it/s]
             all       3395      17314      0.996      0.956      0.0957      0.0845

 Epoch   gpu_mem       box       obj       cls    labels  img_size
 3/200     20.8G   0.01561    0.0191  0.006895        27      1280: 100%|██████████| 849/849 [10:56<00:00,  1.29it/s]
           Class     Images     Labels          P          R     mAP@.5 mAP@.5:.95: 100%|███████   | 187/213 [00:52<00:00,  4.04it/s]
             all       3395      17314      0.996      0.957      0.0957      0.0845

import torch

class SoftNMS:
    def __init__(self, iou_thresh=0.5, sigma=0.5, score_threshold=0.25):
        self.iou_thresh = iou_thresh
        self.sigma = sigma
        self.score_threshold = score_threshold

    def __call__(self, bboxes, scores):
        order = torch.arange(0, scores.size(0)).to(bboxes.device)
        keep = []

        while order.numel() > 1:
            if order.numel() == 1:
                keep.append(order[0])
                break
            else:
                i = order[0]
                keep.append(i)

            iou = self.box_iou_for_nms(bboxes[i], bboxes[order[1:]]).squeeze()

            idx = (iou > self.iou_thresh).nonzero().squeeze()
            if idx.numel() > 0:
                iou = iou[idx]
                newScores = torch.exp(-torch.pow(iou, 2) / self.sigma)
                scores[order[idx + 1]] *= newScores

            newOrder = (scores[order[1:]] > self.score_threshold).nonzero().squeeze()
            if newOrder.numel() == 0:
                break
            else:
                maxScoreIndex = torch.argmax(scores[order[newOrder + 1]])
                if maxScoreIndex != 0:
                    newOrder[[0, maxScoreIndex], ] = newOrder[[maxScoreIndex, 0], ]
                order = order[newOrder + 1]

        return torch.LongTensor(keep)

    def box_iou_for_nms(self, box1, box2):
        # Calculate IoU between two bounding boxes
        pass

在这个类中，SoftNMS 类包含了 soft_nms 函数的核心部分。box_iou_for_nms 方法用于计算两个边界框之间的 IoU。你可以根据具体的需求实现 box_iou_for_nms 方法。



def draw_text_on_image(img, classname):
    font = cv2.FONT_HERSHEY_SIMPLEX
    font_scale = 4
    font_thickness = 10
    text_color = (0, 0, 255)  # 红色（BGR）
    text_position = (80, 150)  # 左上角，距离边缘的距离

    cv2.putText(img, classname, text_position, font, font_scale, text_color, font_thickness)

    return img

def det(info1):
    weights = './best.pt'
    data = 'data/coco128.yaml'
    imgsz = (224, 224)
    device = ''
    half = False
    # Load model
    device = select_device(device)
    model = DetectMultiBackend(weights, device=device, data=data, fp16=half)
    stride = model.stride
    imgsz = check_img_size(imgsz, s=stride)  # check image size
    # Dataloader
    image_paths = [info1]
    dataset = LoadImages(image_paths, img_size=imgsz, transforms=classify_transforms(imgsz[0]))
    # Run inference
    results = []
    for _, im, _, _, _ in dataset:
        im = torch.Tensor(im).to(model.device)
        im = im.half() if model.fp16 else im.float()  # uint8 to fp16/32
        if len(im.shape) == 3:
            im = im[None]  # expand for batch dim

        # Inference
        logits = model(im)
        # Post-process
        pred = F.softmax(logits, dim=1)  # probabilities
        # Process predictions
        top1i = pred.argmax(1).item()  # top 1 index
        results.append(model.names[top1i])
    print(results)
    for idx, image_path in enumerate(image_paths):
        im0 = cv2.imread(image_path)
        classname = results[idx]
        im0 = draw_text_on_image(im0, classname)

        ui.showimg(im0)
        QApplication.processEvents()
    return results[-1]

# 定义一个函数来判断胜负
def judge(player, computer):
    if player == computer:
        return '平局'
    elif (player == 'shitou' and computer == 'jiandao') or (player == 'jiandao' and computer == 'bu') or (
        player == 'bu' and computer == 'shitou'):
        return '玩家赢'
    else:
        return '电脑赢'

class Thread_1(QThread):  # 线程1
    def __init__(self,info1):
        super().__init__()
        self.info1=info1
        self.run2(self.info1)

    def run2(self, info1):
        result = []
        result = det(info1)

        # 定义一个表示电脑出拳选项的列表
        choices = ['shitou', 'jiandao', 'bu']

        # 使用随机函数从列表中选择一个选项作为电脑的出拳
        computer_choice = random.choice(choices)

        # 调用判断函数获取游戏结果
        game_result = judge(result, computer_choice)

        # 打印玩家和电脑的出拳结果
        ui.printf(f"玩家出拳: {result}")
        ui.printf(f"电脑出拳: {computer_choice}")

        # 打印游戏胜负结果
        ui.printf(f"游戏结果: {game_result}")

class Ui_MainWindow(object):
    def setupUi(self, MainWindow):
        MainWindow.setObjectName("MainWindow")
        MainWindow.resize(1280, 960)
        MainWindow.setStyleSheet("background-image: url("./template/carui.png")")
        self.centralwidget = QtWidgets.QWidget(MainWindow)
        self.centralwidget.setObjectName("centralwidget")
        self.label = QtWidgets.QLabel(self.centralwidget)
        self.label.setGeometry(QtCore.QRect(168, 60, 901, 71))
        self.label.setAutoFillBackground(False)
        self.label.setStyleSheet("")
        self.label.setFrameShadow(QtWidgets.QFrame.Plain)
        self.label.setAlignment(QtCore.Qt.AlignCenter)
        self.label.setObjectName("label")
        self.label.setStyleSheet("font-size:50px;font-weight:bold;font-family:SimHei;background:rgba(255,255,255,0.6);")
        self.label_2 = QtWidgets.QLabel(self.centralwidget)
        self.label_2.setGeometry(QtCore.QRect(140, 188, 801, 501))
        self.label_2.setStyleSheet("background:rgba(255,255,255,0.6);")
        self.label_2.setAlignment(QtCore.Qt.AlignCenter)
        self.label_2.setObjectName("label_2")


        self.textBrowser = QtWidgets.QTextBrowser(self.centralwidget)
        self.textBrowser.setGeometry(QtCore.QRect(73, 746, 851, 174))
        self.textBrowser.setStyleSheet("background:rgba(255,255,255,0.6);")
        self.textBrowser.setObjectName("textBrowser")
        self.pushButton = QtWidgets.QPushButton(self.centralwidget)
        self.pushButton.setGeometry(QtCore.QRect(1020, 750, 150, 40))
        self.pushButton.setStyleSheet("background:rgba(53,142,255,1);border-radius:10px;padding:2px 4px;")
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(self.centralwidget)
        self.pushButton_2.setGeometry(QtCore.QRect(1020, 810, 150, 40))
        self.pushButton_2.setStyleSheet("background:rgba(53,142,255,1);border-radius:10px;padding:2px 4px;")
        ......

import torch
import math

class BoxIOU:
    def __init__(self, GIoU=False, DIoU=False, CIoU=False, SIoU=False, EIou=False, eps=1e-7):
        self.GIoU = GIoU
        self.DIoU = DIoU
        self.CIoU = CIoU
        self.SIoU = SIoU
        self.EIou = EIou
        self.eps = eps

    def calculate_iou(self, box1, box2):
        b1_x1, b1_y1, b1_x2, b1_y2 = box1.chunk(4, -1)
        b2_x1, b2_y1, b2_x2, b2_y2 = box2.chunk(4, -1)
        w1, h1 = b1_x2 - b1_x1, (b1_y2 - b1_y1).clamp(self.eps)
        w2, h2 = b2_x2 - b2_x1, (b2_y2 - b2_y1).clamp(self.eps)

        # Intersection area
        inter = (b1_x2.minimum(b2_x2) - b1_x1.maximum(b2_x1)).clamp(0) * 
                (b1_y2.minimum(b2_y2) - b1_y1.maximum(b2_y1)).clamp(0)

        # Union Area
        union = w1 * h1 + w2 * h2 - inter + self.eps

        # IoU
        iou = inter / union
        if self.CIoU or self.DIoU or self.GIoU or self.EIou:
            cw = b1_x2.maximum(b2_x2) - b1_x1.minimum(b2_x1)  # convex (smallest enclosing box) width
            ch = b1_y2.maximum(b2_y2) - b1_y1.minimum(b2_y1)  # convex height
            if self.CIoU or self.DIoU or self.EIou:  # Distance or Complete IoU
                c2 = cw ** 2 + ch ** 2 + self.eps  # convex diagonal squared
                rho2 = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4  # center dist ** 2
                if self.CIoU:
                    v = (4 / math.pi ** 2) * (torch.atan(w2 / h2) - torch.atan(w1 / h1)).pow(2)
                    with torch.no_grad():
                        alpha = v / (v - iou + (1 + self.eps))
                    return iou - (rho2 / c2 + v * alpha)  # CIoU
                elif self.EIou:
                    rho_w2 = ((b2_x2 - b2_x1) - (b1_x2 - b1_x1)) ** 2
                    rho_h2 = ((b2_y2 - b2_y1) - (b1_y2 - b1_y1)) ** 2
                    cw2 = cw ** 2 + self.eps
                    ch2 = ch ** 2 + self.eps
                    return iou - (rho2 / c2 + rho_w2 / cw2 + rho_h2 / ch2)
                return iou - rho2 / c2  # DIoU
            c_area = cw * ch + self.eps  # convex area
            return iou - (c_area - union) / c_area  # GIoU
        elif self.SIoU:
            s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 + self.eps
            s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 + self.eps
            sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5)
            sin_alpha_1 = torch.abs(s_cw) / sigma
            sin_alpha_2 = torch.abs(s_ch) / sigma
            threshold = pow(2, 0.5) / 2
            sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1)
            angle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2)
            rho_x = (s_cw / cw) ** 2
            rho_y = (s_ch / ch) ** 2
            gamma = angle_cost - 2
            distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y)
            omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)
            omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)
            shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4)
            return iou - 0.5 * (distance_cost + shape_cost)
        return iou

class SoftNMS:
    def __init__(self, iou_thresh=0.5, sigma=0.5, score_threshold=0.25):
        self.iou_thresh = iou_thresh
        self.sigma = sigma
        self.score_threshold = score_threshold

    def apply(self, bboxes, scores):
        order = torch.arange(0, scores.size(0)).to(bboxes.device)
        keep = []

        while order.numel() > 1:
            if order.numel() == 1:
                keep.append(order[0])
                break
            else:
                i = order[0]
                keep.append(i)

            iou = BoxIOU().calculate_iou(bboxes[i], bboxes[order[1:]]).squeeze()

            idx = (iou > self.iou_thresh).nonzero().squeeze()
            if idx.numel() > 0:
                iou = iou[idx]
                newScores = torch.exp(-torch.pow(iou, 2) / self.sigma)
                scores[order[idx + 1]] *= newScores

            newOrder = (scores[order[1:]] > self.score_threshold).nonzero().squeeze()
            if newOrder.numel() == 0:
                break
            else:
                maxScoreIndex = torch.argmax(scores[order[newOrder + 1]])
                if maxScoreIndex != 0:
                    newOrder[[0, maxScoreIndex], ] = newOrder[[maxScoreIndex, 0], ]
                order = order[newOrder + 1]

        return torch.LongTensor(keep)




class YOLOv5Classifier:
    def __init__(self, weights, source, data, imgsz, device, view_img, save_txt, nosave, augment, visualize, update,
                 project, name, exist_ok, half, dnn, vid_stride):
        self.weights = weights
        self.source = source
        self.data = data
        self.imgsz = imgsz
        self.device = device
        self.view_img = view_img
        self.save_txt = save_txt
        self.nosave = nosave
        self.augment = augment
        self.visualize = visualize
        self.update = update
        self.project = project
        self.name = name
        self.exist_ok = exist_ok
        self.half = half
        self.dnn = dnn
        self.vid_stride = vid_stride

    def run(self):
        source = str(self.source)
        save_img = not self.nosave and not source.endswith('.txt')  # save inference images
        is_file = Path(source).suffix[1:] in (IMG_FORMATS + VID_FORMATS)
        is_url = source.lower().startswith(('rtsp://', 'rtmp://', 'http://', 'https://'))
        webcam = source.isnumeric() or source.endswith('.streams') or (is_url and not is_file)
        screenshot = source.lower().startswith('screen')
        if is_url and is_file:
            source = check_file(source)  # download

        # Directories
        save_dir = increment_path(Path(self.project) / self.name, exist_ok=self.exist_ok)  # increment run
        (save_dir / 'labels' if self.save_txt else save_dir).mkdir(parents=True, exist_ok=True)  # make dir

        # Load model
        device = select_device(self.device)
        model = DetectMultiBackend(self.weights, device=device, dnn=self.dnn, data=self.data, fp16=self.half)
        stride, names, pt = model.stride, model.names, model.pt
        imgsz = check_img_size(self.imgsz, s=stride)  # check image size

        # Dataloader
        bs = 1  # batch_size
        if webcam:
            view_img = check_imshow(warn=True)
            dataset = LoadStreams(source, img_size=imgsz, transforms=classify_transforms(imgsz[0]),
                                  vid_stride=self.vid_stride)
            bs = len(dataset)
        elif screenshot:
            dataset = LoadScreenshots(source, img_size=imgsz, stride=stride, auto=pt)
        else:
            dataset = LoadImages(source, img_size=imgsz, transforms=classify_transforms(imgsz[0]),
                                 vid_stride=self.vid_stride)
        vid_path, vid_writer = [None] * bs, [None] * bs

        # Run inference
        model.warmup(imgsz=(1 if pt else bs, 3, *imgsz))  # warmup
        seen, windows, dt = 0, [], (Profile(), Profile(), Profile())
        for path, im, im0s, vid_cap, s in dataset:
            with dt[0]:
                im = torch.Tensor(im).to(model.device)
                im = im.half() if model.fp16 else im.float()  # uint8 to fp16/32
                if len(im.shape) == 3:
                    im = im[None]  # expand for batch dim

            # Inference
            with dt[1]:
                results = model(im)

            # Post-process
            with dt[2]:
                pred = F.softmax(results, dim=1)  # probabilities

            # Process predictions
            for i, prob in enumerate(pred):  # per image
                seen += 1
                if webcam:  # batch_size >= 1
                    p, im0, frame = path[i], im0s[i].copy(), dataset.count
                    s += f'{i}: '
                else:
                    p, im0, frame = path, im0s.copy(), getattr(dataset, 'frame', 0)

                p = Path(p)  # to Path
                save_path = str(save_dir / p.name)  # im.jpg
                txt_path = str(save_dir / 'labels' / p.stem) + ('' if dataset.mode == 'image' else f'_{frame}')  # im.txt

                s += '%gx%g ' % im.shape[2:]  # print string
                annotator = Annotator(im0, example=str(names), pil=True)

                # Print results
                top5i = prob.argsort(0, descending=True)[:5].tolist()  # top 5 indices
                s += f"{', '.join(f'{names[j]} {prob[j]:.2f}' for j in top5i)}, "

                # Write results
                text = 'n'.join(f'{prob[j]:.2f} {names[j]}' for j in top



class YOLOv5Classifier:
    def __init__(self, data, weights, batch_size, imgsz, device, workers, verbose, project, name, exist_ok, half, dnn):
        self.data = data
        self.weights = weights
        self.batch_size = batch_size
        self.imgsz = imgsz
        self.device = device
        self.workers = workers
        self.verbose = verbose
        self.project = project
        self.name = name
        self.exist_ok = exist_ok
        self.half = half
        self.dnn = dnn

    @smart_inference_mode()
    def run(self):
        # Initialize/load model and set device
        training = model is not None
        if training:  # called by train.py
            device, pt, jit, engine = next(model.parameters()).device, True, False, False  # get model device, PyTorch model
            half &amp;= device.type != 'cpu'  # half precision only supported on CUDA
            model.half() if half else model.float()
        else:  # called directly
            device = select_device(device, batch_size=batch_size)

            # Directories
            save_dir = increment_path(Path(project) / name, exist_ok=exist_ok)  # increment run
            save_dir.mkdir(parents=True, exist_ok=True)  # make dir

            # Load model
            model = DetectMultiBackend(weights, device=device, dnn=dnn, fp16=half)
            stride, pt, jit, engine = model.stride, model.pt, model.jit, model.engine
            imgsz = check_img_size(imgsz, s=stride)  # check image size
            half = model.fp16  # FP16 supported on limited backends with CUDA
            if engine:
                batch_size = model.batch_size
            else:
                device = model.device
                if not (pt or jit):
                    batch_size = 1  # export.py models default to batch-size 1
                    LOGGER.info(f'Forcing --batch-size 1 square inference (1,3,{imgsz},{imgsz}) for non-PyTorch models')

            # Dataloader
            data = Path(data)
            test_dir = data / 'test' if (data / 'test').exists() else data / 'val'  # data/test or data/val
            dataloader = create_classification_dataloader(path=test_dir,
                                                          imgsz=imgsz,
                                                          batch_size=batch_size,
                                                          augment=False,
                                                          rank=-1,
                                                          workers=workers)

        model.eval()
        pred, targets, loss, dt = [], [], 0, (Profile(), Profile(), Profile())
        n = len(dataloader)  # number of batches
        action = 'validating' if dataloader.dataset.root.stem == 'val' else 'testing'
        desc = f'{pbar.desc[:-36]}{action:>36}' if pbar else f'{action}'
        bar = tqdm(dataloader, desc, n, not training, bar_format=TQDM_BAR_FORMAT, position=0)
        with torch.cuda.amp.autocast(enabled=device.type != 'cpu'):
            for images, labels in bar:
                with dt[0]:
                    images, labels = images.to(device, non_blocking=True), labels.to(device)

                with dt[1]:
                    y = model(images)

                with dt[2]:
                    pred.append(y.argsort(1, descending=True)[:, :5])
                    targets.append(labels)
                    if criterion:
                        loss += criterion(y, labels)

        loss /= n
        pred, targets = torch.cat(pred), torch.cat(targets)
        correct = (targets[:, None] == pred).float()
        acc = torch.stack((correct[:, 0], correct.max(1).values), dim=1)  # (top1, top5) accuracy
        top1, top5 = acc.mean(0).tolist()

        if pbar:
            pbar.desc = f'{pbar.desc[:-36]}{loss:>12.3g}{top1:>12.3g}{top5:>12.3g}'
        if verbose:  # all classes
            LOGGER.info(f"{'Class':>24}{'Images':>12}{'top1_acc':>12}{'top5_acc':>12}")
            LOGGER.info(f"{'all':>24}{targets.shape[0]:>12}{top1:>12.3g}{top5:>12.3g}")
            for i, c in model.names.items():
                acc_i = acc[targets == i]
                top1i, top5i = acc_i.mean(0).tolist()
                LOGGER.info(f'{c:>24}{acc_i.shape[0]:>12}{top1i:>12.3g}{top5i:>12.3g}')

            # Print results
            t = tuple(x.t / len(dataloader.dataset.samples) * 1E3 for x in dt)  # speeds per image
            shape = (1, 3, imgsz, imgsz)
            LOGGER.info(f'Speed: %.1fms pre-process, %.1fms inference, %.1fms post-process per image at shape {shape}' % t)
            LOGGER.info(f"Results saved to {colorstr('bold', save_dir)}")

        return top1, top5, loss

文件名	功能
export.py	导出模型为不同的格式，如TorchScript、ONNX等
softnms.py	实现软非最大抑制算法，用于边界框的筛选
ui.py	实现游戏界面的用户交互和展示功能
val.py	对模型进行验证和评估，计算指标和保存结果
yolov5-softnms.py	结合YOLOv5和软非最大抑制算法，实现目标检测和边界框筛选
classify/predict.py	实现分类器模型的推理功能，可以在多种输入来源上运行
classify/train.py	实现分类器模型的训练功能，支持单个GPU上的训练
classify/val.py	对分类器模型进行验证和评估，计算指标和保存结果
models/common.py	包含一些通用的模型函数和类，用于模型的构建和操作
models/experimental.py	包含一些实验性的模型函数和类，用于模型的构建和操作
models/tf.py	包含一些与TensorFlow 相关的模型函数和类，用于模型的构建和操作
models/yolo.py	包含YOLO模型的相关函数和类，用于YOLO模型的构建和操作
models/init.py	模型模块的初始化文件
segment/predict.py	实现分割模型的推理功能，可以在多种输入来源上运行
segment/train.py	实现分割模型的训练功能，支持单个GPU上的训练
segment/val.py	对分割模型进行验证和评估，计算指标和保存结果
utils/activations.py	包含一些激活函数的实现
utils/augmentations.py	包含一些数据增强的函数和类，用于数据预处理
utils/autoanchor.py	包含自动锚框生成的函数和类，用于目标检测模型的锚框生成
utils/autobatch.py	包含自动批处理的函数和类，用于训练过程中的批处理
utils/callbacks.py	包含一些回调函数的实现，用于训练过程中的回调操作
utils/dataloaders.py	包含一些数据加载器的实现，用于加载和处理数据
utils/downloads.py	包含一些下载数据和模型的函数和类
utils/general.py	包含一些通用的辅助函数和类
utils/loss.py	包含一些损失函数的实现
utils/metrics.py	包含一些评估指标的实现
utils/plots.py	包含一些绘图函数的实现
utils/torch_utils.py	包含一些与PyTorch相关的辅助函数和类
utils/triton.py	包含与Triton Inference Server相关的函数和类
utils/init.py	工具模块的初始化文件
utils/aws/resume.py	包含AWS训练恢复的函数和类
utils/aws/init.py	AWS模块的初始化文件
utils/flask_rest_api/example_request.py	包含Flask REST API的示例请求函数和类
utils/flask_rest_api/restapi.py	包含Flask REST API的实现，用于构建和运行REST API
utils/loggers/init.py	日志记录器模块的初始化文件
utils/loggers/clearml/clearml_utils.py	包含ClearML日志记录器的辅助函数和类
utils/loggers/clearml/hpo.py	包含ClearML日志记录器的超参数优化函数和类
utils/loggers/clearml/init.py	ClearML日志记录器模块的初始化文件
utils/loggers/comet/comet_utils.py	包含Comet日志记录器的辅助函数和类
utils/loggers/comet/hpo.py	包含Comet日志记录器的超参数优化函数和类
utils/loggers/comet/init.py	Comet日志记录器模块的初始化文件
utils/loggers/wandb/wandb_utils.py	包含WandB日志记录器的辅助函数和类
utils/loggers/wandb/init.py	WandB日志记录器模块的初始化文件
utils/segment/augmentations.py	包含一些分割模型的数据增强函数和类
utils/segment/dataloaders.py	包含一些分割模型的数据加载器的实现
utils/segment/general.py	包含一些分割模型的通用辅助函数和类
utils/segment/loss.py	包含一些分割模型的损失函数的实现
utils/segment/metrics.py	包含一些分割模型的评估指标的实现
utils/segment/plots.py	包含一些分割模型的绘图函数的实现
utils/segment/init.py	分割模块的初始化文件

import matplotlib.pyplot as plt
import seaborn as sns

# Setting up the aesthetic style for the plots
sns.set(style="whitegrid")

# Plotting the training and testing loss
plt.figure(figsize=(12, 6))
plt.plot(data['epoch'], data['train/loss'], label='Training Loss')
plt.plot(data['epoch'], data['test/loss'], label='Testing Loss')
plt.title('Training and Testing Loss Across Epochs')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

# Plotting the accuracy (Top-1 and Top-5)
plt.figure(figsize=(12, 6))
plt.plot(data['epoch'], data['metrics/accuracy_top1'], label='Top-1 Accuracy')
plt.plot(data['epoch'], data['metrics/accuracy_top5'], label='Top-5 Accuracy')
plt.title('Top-1 and Top-5 Accuracy Across Epochs')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

# Plotting the learning rate adjustments
plt.figure(figsize=(12, 6))
plt.plot(data['epoch'], data['lr/0'])
plt.title('Learning Rate Adjustments Across Epochs')
plt.xlabel('Epochs')
plt.ylabel('Learning Rate')
plt.show()