MTCNN

11月

4742 0

简介：MTCNN主要由三个框架组成，分别是PNet，RNet，ONet。

基本原理：Proposal Network (P-Net)：该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归，对候选窗口进行校准，然后通过非极大值抑制（NMS）来合并高度重叠的候选框。Refine Network (R-Net)：该网络结构还是通过边界框回归和NMS来去掉那些false-positive区域。只是由于该网络结构和P-Net网络结构有差异，多了一个全连接层，所以会取得更好的抑制false-positive的作用。Output Network (O-Net)：该层比R-Net层又多了一层卷基层，所以处理的结果会更加精细。作用和R-Net层作用一样。但是该层对人脸区域进行了更多的监督，同时还会输出5个地标（landmark）。

首先将RNet的输出resize成正方形，接下来的操作和对应的RNet部分相似，只是再喂入ONet之前图片是resize乘48x48。

主要应用：人脸识别

相关案例：