分享好友 最新动态首页 最新动态分类 切换频道
目标检测——PP-YOLO算法解读
2024-12-25 16:28

PP-YOLO系列,均是基于百度自研PaddlePaddle深度学习框架发布的算法,2020年基于YOLOv3改进发布PP-YOLO,2021年发布PP-YOLOv2和移动端检测算法PP-PicoDet,2022年发布PP-YOLOE和PP-YOLOE-R。由于均是一个系列,所以放一起解读,方便对比前后改进地方。


YOLO系列算法解读
YOLOv1通俗易懂版解读、SSD算法解读、YOLOv2算法解读、YOLOv3算法解读、YOLOv4算法解读、YOLOv5算法解读、YOLOR算法解读、YOLOX算法解读、YOLOv6算法解读、YOLOv7算法解读、YOLOv8算法解读、YOLOv9算法解读、YOLOv10算法解读

PP-YOLO系列算法解读
PP-YOLO算法解读、PP-YOLOv2算法解读、PP-PicoDet算法解读、PP-YOLOE算法解读、PP-YOLOE-R算法解读



PP-YOLO(2020.7.23)

论文:PP-YOLO: An Effective and Efficient Implementation of Object Detector
作者:Xiang Long, Kaipeng Deng, Guanzhong Wang, Yang Zhang, Qingqing Dang, Yuan Gao, Hui Shen, Jianguo Ren, Shumin Han, Errui Ding, Shilei Wen
链接:https://arxiv.org/abs/2007.12099
代码:https://github.com/PaddlePaddle/PaddleDetection



Backbone部分
PP-YOLO将YOLOv3的DarkNet-53替换成ResNet50-vd-dcn。由于直接替换成ResNet50-vd会掉点,所以将最后一个stage的3x3卷积替换成了DCN(Deformable Convolutional Networks,可变形卷积)。用来做预测的特征图为C3,C4,C5。

Neck部分
拿Backbone输出的C3,C4,C5特征图应用FPN,其中FPN经过DropBlock、CoordConv和SPP改进。

Head部分
和YOLOv3一样,分三个特征图输出,每个特征图每个网格设置3个anchor,每个网格位置输出3x(k+6),增加一个通道预测IoU大小,对于NxN大小的特征图输出为NxNx3x(k+6)的tensor。其他改进的地方为在最后预测层3x3卷积中加入CoordConv。

  • Larger Batch Size 大的batchsize可以增加训练稳定性得到更好的结果。将batchsize由64变成192。
  • EMA 在训练模型时,保持训练参数的移动平均线通常是有益的。
  • DropBlock 只在FPN中应用DropBlock。
  • IoU Loss 与YOLOv4不同的是,作者并没有直接用IoU损失代替l1损失,而是增加了一个分支来计算IoU损失。由于作者发现各种IoU损失的改善效果相似,所以选择了最基本的IoU损失。
  • IoU Aware 在YOLOv3中,分类概率和objectness得分相乘作为最终检测目标的置信度得分,但是这没有考虑定位精度。为了解决这一问题,增加了IoU预测通道来衡量定位的准确性。即输出通道数由B*(5+C)增加为B*(6+C)。在训练过程中,采用IoU感知损失训练IoU预测值。在推理过程中,将预测的IoU乘以分类概率和objectness得分,计算出最终的检测置信度,该置信度与定位精度更相关。然后将最终检测置信度用作后续NMS的输入。虽然IoU感知分支会增加额外的计算成本。但是,只增加了0.01%的参数个数和0.0001%的flop,几乎可以忽略不计。
  • Grid Sensitive 借鉴YOLOv4的改进
  • Matrix NMS 受到了soft-NMS的启发,并行的方式实现NMS,更快。
  • CoordConv 它的工作原理是通过使用额外的坐标通道让卷积访问自己的输入坐标。CoordConv允许网络学习完全的变换不变性或不同程度的变换依赖性。考虑到CoordConv将在卷积层中增加两个输入通道,因此将增加一些参数和FLOPs。为了尽可能减少效率的损失,作者没有改变骨干中的卷积层,只将FPN中的1x1卷积层和检测头中的第1个卷积层替换为CoordConv。
  • SPP 和YOLOv4一样,也引入了SPP层增大感受野。
  • Better Pretrain Model 使用蒸馏的ResNet50-vd模型作为预训练模型。

最新文章
英国留学条件有些什么 就读优势有哪些
英国大学是非常出名的,英国一直以传统优秀的教学而闻名世界,因此很多的同学都会选择前往英国进行留学,那么“英国留学条件有些什么”呢,让我们一起来简单的了解一下吧。1、学历要求高中留学:申请英国高中留学,学生通常需要完成初中阶
祈际网络|同城达人本地探店抖音推广费用是多少?
本地达人探店作为一种新兴的营销方式,其费用构成因达人的粉丝等级、推广方式和运营模式而异。祈际网络凭借其专业的服务和深入的市场洞察,为品牌提供了多样化的探店营销解决方案,帮助品牌实现成本效益最大化。祈际网络作为一个有着丰富实
【漫画推荐】韩漫推荐
​​1.《乖乖女恋爱指南》    我们的女主郑小乖人如其名,是个乖乖女,爱好列日程表,是个每天完成日程表的每一项就觉得很幸福的人。因为受学长美色的诱惑加入了编(you)程(xi)社团。撞破了男主在玩女号的事,以帮助她追学长为交换条
淘宝游戏店铺开店流程,怎么开店?
随着移动互联网以及智能移动终端设备在我国的快速发展,我国游戏市场用户规模持续增长,其中移动游戏的快速发展远超端游和页游,我国游戏市场逐步确立了以发展移动游戏为主的发展态势。很多商家想要开一个游戏类的专营店铺却不知道怎么申请
怎样让百度快速收录的新方法
百度从在07年10月份至今收录新站以及索引站点都不是那么速度,就具体情况中国SEO联盟Dragon提出-----如何让百度快速收录新方法!  1.在百度提交网址 但现在百度自动收录的速度已经让众人所知,所以提出以下的方法。供我亲爱的朋友们、战友
显示器能效测试怎么做?
显示器是一种可以将电子文件显示到屏幕上的输入输出设备,在我们日常生活中比较常见。显示器厂家在产品出厂前一般会办理显示器能效测试,本文将为您介绍显示器能效测试办理流程。显示器能效测试标准为GB24850。GB 24850标准适用于在电网电
超平民的华为系百瓦级超级快充方案,只要56元即可搞定——淘宝购入的拆机华为智选100W充电器使用评测
之前看到酷安上有一篇图文推荐这个拆机头,看起来还不错,价格也美丽(甚至相比原文的标价还降价了),遂购入。虽然我自己用的红米,但家人用的华为系,买一个做备用头也可以。本文所评测产品为本人自费购买,无利益相关。评测设备为业余设
把别人照片发到朋友圈违法吗
第一步,工伤认定程序  1.发生工伤后单位应当自事故伤害发生之日或者被诊断、鉴定为职业病之日起30日内,向统筹地区社会保险行政部门提出工伤认定申请。;单位未按规定提出工伤认定的,职工必须在1年内提出工伤认定的申请。  2.劳动者提
谷歌SEO中,什么是link wheeling策略?
在数字化时代,搜索引擎优化(SEO)已成为企业网络营销战略中的核心环节。通过提高网站在搜索引擎结果页面(SERP)上的排名,企业能够吸引更多的目标流量,进而转化为潜在客户和实际销售。而我,作为一名在SEO领域摸爬滚打多年的实践者,深
淘宝无痕代码标题技术有哪些好处
淘宝无痕代码标题技术有哪些好处淘宝各种图片,标题,转链接,客服,综合技术过排除查防排查如有不懂请咨询下面请忽略淘宝无痕代码标题技术是当前电商行业备受瞩目的一项创新技术。它的出现不仅为淘宝店铺带来了全新的营销方式,更为卖家们
相关文章
推荐文章
发表评论
0评