YOLO系列算法v1-v7的之路(更新中...)
发布网友
发布时间:2024-10-24 17:28
我来回答
共1个回答
热心网友
时间:2024-10-29 21:00
YOLO系列算法自推出以来,因其速度快、精度高和部署方便的特点,在多个领域得到广泛应用。本文将简要概述YOLOv1-v4的发展历程,并针对v5-v7进行深入剖析,以理解其深层算法原理及改进策略。
1. YOLO V1
Paper下载地址:You Only Look Once:Unified, Real-Time Object Detection 代码复现:github.com/U-zzd/yolov1...
YOLO V1采用卷积神经网络直接实现检测过程,将Faster-RCNN的候选区和对象识别两个阶段合二为一,分为3个步骤。主要流程如图1所示:
1.1 模型结构
1.2 网络结构
整个网络包括24个卷积层和2个全连接层,其中卷积层的前20层是修改后的GoogLeNet。网络经过最后一个全连接层得到一个1470×1的输出,7×7×30的一个张量,即每个网格都有一个30维的输出,代表预测结果。以PASCAL VOC数据集为例,总共包含20个类别,即30=(5*2+20)。2个Bounding Box,一个预测大目标,一个预测小目标。
1.3 损失函数
1.4 V1的优点
1.5 YOLO系列比较
在YOLO v1的模型中,检测头就是最后的2个全连接层(Linear in PyTorch),它们是参数量最大的2个层,也是最值得改进的2个层。后面的YOLO模型都对这里进行改进:YOLO v1一共预测49个目标,一共98个框。
2. YOLO V2
paper地址:YOLO9000:Better, Faster, Stronger
YOLOv2是YOLO系列的第二代模型,首次使用基于锚框进行检测,并提出多尺度训练等方法,为后续的YOLOv3、YOLOv4、YOLOv5、PPYOLO奠定了基础。
2.1 V1的缺点
2.2 网络结构
2.3 Backbone:Darknet-19
为了进一步提升性能,YOLO v2重新单独训练了一个Darknet-19作为Backbone,是按照分类网络去train的,用的数据集是imagenet,是1000个classes,所以最后加了一个softmax层,使用cross entropy loss。如下图5所示:
2.4 引入Batch Normalization
2.5 引入Anchor Box机制
YOLO v1直接回归(x,y,w,h)范围比较大,预测框准确率低,现在想预测一个偏移量,来增加对预测框回归的准确度。Anchor可以把它理解为一个预先定义好的框,它的位置、宽高都是已知的,是一个参照物,供我们预测时参考。基于anchor的偏移量的意思是,anchor的位置是固定的,偏移量=目标位置-anchor的位置。
2.6 预测结果的改变
YOLO V2每个网格有5个anchor,生成5个预测框,每个预测框都会有一个类别预测概率:输出格式为[N, 13, 13, 125],125 = 5 x 5(c, x, y, w, h) + 5 x 20(classes)。
2.7 细粒度特征
2.8 损失函数
2.9 YOLO系列比较
3. YOLO V3
paper地址:YOLOv3: An Incremental Improvement
3.1 V2的缺点
3.2 网络结构
3.3 Backbone:Darknet-53
YOLOv3将原来的Darknet-19改进为Darknet-53。主要由1×1和3×3的卷积层组成,每个卷积层之后包含一个批量归一化层和一个Leaky ReLU,加入这两个部分的目的是为了防止过拟合。卷积层、批量归一化层以及Leaky ReLU共同组成Darknet-53中的基本卷积单元CBL(Conv+BN+Leaky relu)。因为在Darknet-53包含53个这样的DBL,所以称其为Darknet-53。
相比于Darknet-19的改进:
3.4 Neck:FPN
3.5 Yolo Head
每一个尺度网格都负责预测3个边界框,且COCO数据集有80个类。所以网络单个尺度的输出张量应该是:
N ×N ×[3∗(4+1+80)]
3.6 损失函数
3.7 YOLO系列比较
4. YOLO V4
paper地址:arxiv.org/pdf/2004.1093...
4.1 网络结构
4.2 Input端
4.3 BackBone
4.4 Neck:FPN+PAN
4.5 Yolo Head
4.6 损失函数
4.7 YOLO系列比较
5. YOLO X
paper地址:https://arxiv.org/abs/2107.0843
6. YOLO V5
paper地址:
7. YOLO V6
paper地址:
8. YOLO V7
paper地址:
一篇搞定目标检测YOLO v1到YOLO X算法(附代码+数据集) 目标检测--YOLO v1 论文阅读笔记(附代码) 你一定从未看过如此通俗易懂的YOLO系列(从V1到V5)模型解读! 目标检测YOLO系列算法精讲:从yolov1至yolov4的进阶之路(呕心沥血2万字超全整理,建议收藏!)_源代码杀手的博客-CSDN博客_yolo系列 对比 目标检测--YOLO v3论文阅读笔记 江大白:深入浅出Yolo系列之Yolov3&Yolov4&Yolov5&Yolox核心基础知识完整讲解 修仙:YOLOv1 损失函数代码详解(pytorch)