人工智能培训

搜索

YOLO又更新了!YOLOv3——这可能是目前最好强的目标检测算法 ...

[复制链接]
ranyi170 发表于 2018-4-14 15:58:02 | 显示全部楼层 |阅读模式
ranyi170 2018-4-14 15:58:02 2512 0 显示全部楼层
YOLOv3  : An Incremental Improvement



就在上个月,华盛顿大学的大牛Joseph Redmon又更新了自己的YOLO算法,推出了第三版YOLOv3,论文与相关代码已在官网更新:http://pjreddie.com


让我们一起来解读一下YOLOv3吧!




Comparison to Other Detectors
与其他检测器相比较
首先在性能上,YOLOv3还是一如既往的快速与准确,虽然YOLOv1性能不及SSD、YOLOv2在性能略超SSD算法,但是YOLOv3的出现可以说是一举击败SSD成为目前开源通用目标检测算法的领头羊。


以下两图分别是现在领先的一些关于目标检测领域算法的精准度与相应时间的图表和在COCO数据集上的各算法的性能表现(均来自darknet官网)
B1T30a80MqqOJGq0.jpg

VCupQ973gH8T7gsZ.jpg

Bounding Box Prediction
边框预测


与之前YOLO版本一样,YOLOv3的anchor boxes也是通过聚类的方法得到的。YOLOv3对每个bounding box预测四个坐标值(tx, ty, tw, th),tx、ty、tw、th分别代表bounding box的中心点横纵坐标和bounding box的长宽。对于预测的cell即单个网格(一幅图划分成S×S个网格cell)根据图像左上角的偏移(cx, cy),以及前序bounding box的宽和高pw, ph可以对bounding box按如下的方式进行预测:
xijIg1t600TAvtRq.jpg 在训练这几个坐标值的时候采用了sum of squared error loss即平方和距离误差损失,选择这种方式的原因是误差可以很快的计算出来。YOLOv3对每个bounding box通过逻辑回归预测一个物体的得分,如果预测的这个bounding box与真实的边框值大部分重合且比其他所有预测的要好,那么这个值就为1。如果重叠部分没有达到一个阈值(yolov3中这里设定的阈值是0.5),那么这个预测的bounding box将会被忽略,也就是会显示成没有损失值。


aB6C56Y7B6ez6z54.jpg

Class Prediction
分类预测


对每个bounding box使用multi-label classification(多标签分类)。YOLOv的分类方式没有使用YOLOv2中的softmax分类,只是使用了简单的逻辑回归进行分类,采用的binary cross-entropy loss(二值交叉熵损失)。


Predictions Across Scales
跨尺度预测


作者参考了FPN的设计,每种尺度预测三个box,anchor的设计方式仍然使用聚类的方法得到9 个聚类中心,再将其按照大小均分给3种尺度。尺度1:在基础网络之后添加一些卷积层再输出box信息;尺度2:从尺度1中的倒数第二层的卷积层上采样再与最后一个16×16大小的特征图相加,再次通过多个卷积层后输出box信息,相比尺度1变大两倍;尺度3:与尺度2类似使用了32×32大小的特征图。可以参考网络结构定义文件yolov3.cfg。


Feature Extractor
特征提取


新的网络结构是一种基于YOLOv2的Darknet-19网络和新奇的残余网络的混合网络结构。在模型里添加了很多表现很好的快速连接的3×3和1×1的卷积层,于是这个模型就相比之前显得特别大,如下图:


M72y7vP4WgcuvAWg.jpg

足足有53个卷积层,作者将此称为Darknet-53。




通过论文可以看到作者对YOLO算法做了很多尝试,很多步骤都用了不同的方法进行尝试,不能说完美,向对于较小物体的检测上YOLO确实做得不好(类似多个待检测物体出现在一个cell中这种情况),同时为了追求速度mAP的值也偏低。


接下来就是可以实战中使用YOLOv3了,具体过程官网有完整的说明。
大家有疑惑的话可以留言,欢迎共同讨论!




EMf3Z3FoR3b3933r.jpg



爱胡思乱想


渴望成为优秀学生的



路同学愿和你谈谈心。




路同学

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 返回列表 发新帖

ranyi170当前离线
新手上路

查看:2512 | 回复:0

快速回复 返回顶部 返回列表