PPCNN:细粒度特征提取和定位用于目标检测

2022-09-01 12:20:00
aiadmin
原创
2488

近年来,深度卷积神经收集正在盘算机视觉上得到了优异的机能。深度卷积神经收集以切确地分类主意消息而驰名,并采用了简便的卷积编制构造来下降图层的繁复性。即日给专家分享一个简便的检测收集。

近年来,深度卷积神经收集正在盘算机视觉上得到了优异的机能。深度卷积神经收集以切确地分类主意消息而驰名,并采用了简便的卷积编制构造来下降图层的繁复性。基于深度卷积神经收集观点计划的VGG收集。VGGNet正在对大领域图像举办分类方面得到了远大的机能。该收集计划了一堆小卷积滤波器,使收集构造特殊简便,但收集有少许定位差错。

就有琢磨者提出了奇特的收集架构,PPCNN(金字塔池化卷积神经收集),以削减定位差错,并提取高级特性图。该收集由改正的VGGNet和U-shape特性金字塔收集构成。先容了一种提取和搜求主意的小特性消息并从源图像中检测小物体的收集。该伎俩正在定位和检测职司中得到了更高的精度。

Facebook的特性金字塔收集Feature Pyramid Networks(FPN)。FPN闭键处置的是物体检测中的众标准题目,通过简便的收集邻接蜕化,正在基础不扩充原有模子盘算量景况下,大幅度提拔了小物体检测的机能。咱们将从论文配景,论文思念,结果与结论几方面研商此论文。

正在物体检测内部,有限盘算量景况下,收集的深度(对应到感应野)与stride一样是一对抵触的东西,常用的收集构造对应的stride凡是会较量大(如32),而图像中的小物体乃至会小于stride的巨细,形成的结果即是小物体的检测机能快速消重。古板处置这个题目的思绪网罗:

众标准演练和测试,又称图像金字塔,如图1(a)所示。目前险些整个正在ImageNet和COCO检测职司上得到好收获的伎俩都应用了图像金字塔伎俩。然而云云的伎俩因为很高的期间及盘算量花消,难以正在实践中行使。

特性分层,即每层区分预测对应的scale分袂率的检测结果。如图1(c)所示。SSD检测框架采用了似乎的思念。云云的伎俩题目正在于直接强行让差异层进修同样的语义消息。而对待卷积神经收集而言,差异深度对应着差异宗旨的语义特性,浅层收集分袂率高,学的更众是细节特性,深层收集分袂率低,学的更众是语义特性。

针对这些题目,提出了特性金字塔收集FPN,如上图(d)所示,收集直接正在从来的单收集上做删改,每个分袂率的feature map引入后一分袂率缩放两倍的feature map做element-wise相加的操作。通过云云的邻接,每一层预测所用的feature map都交融了差异分袂率、差异语义强度的特性,交融的差异分袂率的feature map区分做对应分袂率巨细的物体检测。云云确保了每一层都有合意的分袂率以及强语义特性。同时,因为此伎俩只是正在原收集根底上加上了出格的跨层邻接,正在实践行使中险些不扩充出格的期间和盘算量。将FPN行使正在Faster RCNN上的机能,正在COCO上抵达了state-of-the-art的单模子精度。

全体而言,FPN区分正在RPN和Fast RCNN两步中起到影响。此中RPN和Fast RCNN区分闭切的是召回率和正检率,正在这里比拟的目标区分为Average Recall(AR)和Average Precision(AP)。区分比拟了差异标准物体检测景况,小中大物体区分用s,m,l暗示。

与RPN相同,FPN每层feature map参预3*3的卷积及两个相邻的1*1卷积区分做分类和回归的预测。正在RPN中,实行比拟了FPN差异层feature map卷积参数共享与否,出现共享照旧能抵达很好机能,证明特性金字塔使得差异层学到了无别宗旨的语义特性。

金字塔池化收集应承从差异卷积层中的众标准特性动作输入,并提取无别标准的输出特性图,如上图所示。琢磨者提出了用VGGNet正在u-shape特性金字塔收集中构修的改正的收集架构来提取高级特性图。该特性金字塔收集的特性提取流程如下图所示。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号