网络知识 娱乐 YOLOv5结构分析与理解—图解

YOLOv5结构分析与理解—图解

目录

网络模型及网络结构

网络结构详情

代码的整体目录

代码detect.py测试

 各个模块

 整体结构

其他资料

4种网络的宽度

yolov5各个网络模型性能比较

 yolov5结构​

 yolov5四种网络的深度

 yolov5网络结构图

一些工具代码

voc2yolo.py


        YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。YOLOv5融合了数千小时研发过程中学到的经验教训和最佳实践。

官方文档:Quick Start - YOLOv5 Documentation (ultralytics.com)

代码仓库:ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite (github.com)


网络模型及网络结构

网络结构详情

代码的整体目录

代码detect.py测试

 各个模块

 整体结构

其他资料

来着江大白(官方一直在更新,图不一定准)和yolov5官方

4种网络的宽度

yolov5各个网络模型性能比较

 yolov5结构

 yolov5四种网络的深度

 yolov5网络结构图

一些工具代码

voc2yolo.py

from os import getcwd
import glob

classes = ["face", "face_mask"]

def convert(size, box):
    dw = 1.0 / size[0]
    dh = 1.0 / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)

def convert_annotation(image_name):
    in_file = './val/xmls/' + image_name[:-3] + 'xml' # xml文件路径
    out_file = open('./val/labels/' + image_name[:-3] + 'txt', 'w')  # 转换后的txt文件存放路径
    with open(in_file) as f:
        try:
            import xml.etree.cElementTree as ET
        except ImportError:
            import xml.etree.ElementTree as ET
        tree = ET.parse(f)  # 
        root = tree.getroot()  # 获取根节点 
        #
        # xml_text = f.read()
        # root = ET.fromstring(xml_text)
        size = root.find('size')
        if size is not None:
            w = int(size.find('width').text)
            h = int(size.find('height').text)
            for obj in root.iter('object'):
                cls = obj.find('name').text
                if cls not in classes:
                    # print(cls)
                    continue
                cls_id = classes.index(cls)
                xmlbox = obj.find('bndbox')
                b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
                     float(xmlbox.find('ymax').text))
                if w != 0 and h != 0:
                    bb = convert((w, h), b)
                    out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + 'n')
wd = getcwd()

if __name__ == '__main__':
    for image_path in glob.glob("./val/images/*.jpg"):  # 每一张图片都对应一个xml文件这里写xml对应的图片的路径
        image_name = image_path.split('\')[-1]
        convert_annotation(image_name)

返回顶部