yolov1, yolo v2 和yolo v3系列

2020-04-13 11:30:20 蜻蜓队长

      目标检测模型主要分为two-stage和one-stage, one-stage的代表主要是yolo系列和ssd。简单记录下学习yolo系列的笔记。

1 yolo V1

   yolo v1是2015年的论文 you only look once:unified,real-time object detection 中提出,为one-stage目标检测的开山之作。其网络架构如下:(24个卷积层和两个全连接层,注意最后一个全连接层可以理解为1*4096到1*1470(7*7*30)的线性变换)

  yolo v1的理解主要在于三点:

  1.1 网格划分: 输入图片为448*448,yolo将其划为为49(7*7)个cell, 每个cell只负责预测一个物体框, 如果这个物体的中心点落在了这个cell中,这个cell就负责预测这个物体

  

  1.2  预测结果:最后网络的输出为7*7*30, 也可以看做49个1*30的向量,每个向量的组成如下: (x, y, w, h, confidence) *2 + 20; 即每一个向量预测两个bounding box及对应的置信度,还有物体属于20个分类(VOC数据集包括20分类)的概率。

 

      1.3  Loss 函数理解:loss函数如下图所示,下面几个概念需要理清楚

       s2:最后网络的输出为7*7*30, 因此49个cell;

       B: 每个cell(1*30)预测了两个bbox,因此B=2,只有和ground truth具有最大IOU的bbox才参与计算

       7*7的正掩膜

以上内容来自于网络,如有侵权联系即删除
相关文章

上一篇: django的认证演变过程分析

下一篇: 基于Java的捎带电梯系统

在线咨询
客户经理