Fast RCNN

1.简介

Fast R-CNN是作者Ross Girshick继R-CNN后的又一力作。同样使用VGG16作为网络的backbone，与R-CNN相比训练时间快9倍，测试推理时间快213倍，准确率从62%提升至66%(再Pascal VOC数据集上)。

原论文名称:Fast R-CNN

如上图所示，将一张图像输入到Deep ConvNet中得到图像的特征图，根据ROI区域与整体图像的坐标进行特征映射，能够得到每一个候选区域的特征矩阵。

将每一个特征矩阵通过ROI pooling layer,池化到固定尺寸（7*7）,然后展平为向量。

之后ROI feature vector并联两个FC，其中一个用于目标概率预测（softmax），另一个用于边界框参数的回归(bbox regressor)

并非使用ss算法得到的所有候选框。

如上图所示,该数据集有20个类别，1个背景，所以上图第一个节点为背景概率，后面20个节点为检测目标种类的概率。

输出对应N+1个类别的候选边界框回归参数（dx,dy,dw,dh）,共（N+1）×4个节点、

px,py,pw,ph分别为候选框的中心x,y坐标，以及宽高

Gx,Gy,Gw,Gh分别为最终预测的边界框中心x,y坐标以及宽高

橙色:候选边界框

红色:最终预测边界框

因为再Fast RCNN中需要预测N+1个类别的概率以及边界框的回归参数，所以定义了两个损失函数:分类损失函数和边界框回归损失函数

p是分类器预测的softmax概率分布p=( p0,…, pk )

u对应目标真实类别标签

实际上就是针对多分类问题的交叉熵损失。

u对应目标真实类别标签，当为背景时，则该项为0，也就不存在什么边界框回归损失了。

今天的文章fast rcnn详解_Fast RCNN图像标记分享到此就结束了，感谢您的阅读，如果确实帮到您，您可以动动手指转发给其他人。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/58486.html