专利 基于Faster R-CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210355592.3 (22)申请日 2022.04.06 (71)申请人重庆大学地址 400044 重庆市沙坪坝区沙正街174号 (72)发明人牛晓博　何彦　郝传鹏　康玲　刘雪晖　 (74)专利代理机构重庆航图知识产权代理事务所(普通合伙) 50247 专利代理师孙方 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/40(2022.01) G06V 10/84(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01)G06V 10/764(2022.01) G06T 3/00(2006.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于Faster R-CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法及系统 (57)摘要本发明公开一种基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，通过无人机采用大型复杂结构件表面缺陷区域图像；然后进行图像标注增强处理，提取特征及特征融合，对缺陷位置粗定位和分类；最后通过分类和回归网络进行缺陷的分类以及位置的精调，最终得到大型复杂结构件表面缺陷类别和位置。本方法解决了目前针对大型构件的多类多尺寸的表面缺陷不能进行准确分类和定位的问题，采用自适应的缺陷检测定位框和特征金字塔策略，相对于传统的缺陷检测方式，该方法具有识别准确度高和定位精确的特点，同时针对小缺陷改进了更适合样本缺陷的锚选框，为大型构件缺陷严重程度的评估提供了快速、准确、有效的检测方法。权利要求书3页说明书10页附图3页 CN 114693657 A 2022.07.01 CN 114693657 A 1.基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：包括以下步骤： (1)获取大型复杂结构件表面缺陷区域的图像数据； (2)标注采集到的图像中的缺陷的位置和类别信息，生成用于模型训练的标注文件； (3)将采集到的图像数据进行图像变换处理，根据图像变换处理生成包含标签信息文件； (4)基于Resnet提取图像的特征图形成不同的特征层； (5)将不同的特征层进行特征融合，在图像的特征空间中构造金字塔，利用低层特征和高层特征分别在不同的特征层上进行预测； (6)根据提取的特征得到缺陷位置对缺陷进行粗定位； (7)根据缺陷位置将提取的缺陷输入到分类和回归网络进行缺陷的分类以及位置的精调，最终得到大型复杂结构件表面缺陷类别和位置。 2.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述缺陷位置通过标注边界框的左上点和右下点像素坐标进行表征，所述缺陷类别和位置信息保存在.xml文件中。 3.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述图像变换处理是对原图像进行增强扩充处理，所述增强扩充处理包括采用仿射变化、运动模糊、光照变换中任一种或多种组合的方式。 4.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述基于Resnet提取图像的特征的具体步骤如下：用ResNet ‑50网络先对大型复杂结构件图像进行特征提取，得到多个阶段输出的第一特征图，根据大型复杂结构件图像确定对应的分辨率；确定特征提取网络的卷积核，根据卷积核进行下采样操作，并以全局平均池化层为全连接层，在为每两个全连接层增加残差边，形成残差结构。 5.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述特征融合的具体步骤如下：将特征图分别输入特征金字塔网络FPN，通过上采样反卷积操作将较深层的特征图放大到和较浅层的特征图一样的尺寸；将自底向上生成的特征图通过卷积运算降低通道数；通过横向连接将上采样反卷积操作的结果和卷积运算后具有相同通道数的特征图进行逐元素相加，实现低级特征和高级语义特征的融合。 6.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述缺陷粗定位的具体步骤如下：锚框生成：在特征图上生成锚点，并映射到原图的对应位置，然后以原图上的锚点为中心，在原图像中生成不同的长宽比和尺度的锚框；锚框分类：在每个特征点上分类是否属于前景和背景并对锚框位置参数进行回归，分类采用先将特征图进行卷积，进一步提取特征，然后将通道数映射到对应的类别；最后计算概率；位置回归：根据通道数映射对应锚框的位置与大小，回归的参数分别是矩形框中心点权　利　要　求　书 1/3 页 2 CN 114693657 A 2与锚框中心点横、纵坐标的位移以及矩形框长宽与锚框长宽的比例；锚框后处理：将回归得到的候选区域的宽、高限制在输入图像尺寸范围内；将剩余的候选区域按前景概率排序，接着使用非极大值抑制剔除掉重复的候选区域，最后从剔除后的结果中保留存在缺陷的候选区域。 7.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述步骤(7)中的缺陷的分类以及位置的精调的具体步骤如下： ROI Pooling：使用ROI Pooling将不同尺寸的各个ROI都映射至相同的大小；将每个可能存在缺陷的候选区域ROI缩放到特征图尺寸范围内对应的区域，然后将该区域平均划分，对网格的每一份都进行最大池化处理，并将ROI Pooling后的结果展开成一维向量； ROI分类与回归：将展开的一维向量输入全连接层进行缺陷的分类和位置回归，全连接层与softmax计算每个可能存在缺陷的候选区域具体属于哪个缺陷，输出对应每个类别的概率向量；同时再次利用边界框回归获得每个候选区域的位置偏移量，用于回归缺陷位置检测框。 8.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：还包括模型训练，所述模型训练步骤具体如下：数据划分：将采集的全部数据分为训练数据集和测试数据集，随机选取部分数据作为训练集用于模型训练获取最优模型参数，其余数据作为测试数据集用于评估模型的性能；训练策略：对特征提取网络进行预训练得到初始化权重，使用采集到的图像数据进行训练，训练过程采用交替优化训练。 9.如权利要求1所述的基于Faster R‑CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法，其特征在于：所述交替优化训练的步骤如下： (1)在预训练好的模型上训练区域生成网络：损失函数设置如下：式中， i表示第i个锚框； pi表示锚框区域预测为缺陷的概率； pi代表对应的真实标签； ti代表预测的边界框参数向量，包括边界框中心点坐标： tx， ty，边界框的宽和高： tw， th；代表第i个锚框对应的真实框， λ表示权重平衡参数，区域生成网络的分类损失采用交叉熵损失函数，位置回归损失采用Smooth L1 Loss损失函数； (2)利用训练好的区域生成网络，根据生成的候选框对特征提取网络和Fast RCNN网络进行训练； (3)对区域生成网络进行第二次训练，同时保持特征提取网络和Fast RCNN网络的参数层保持不变，对区域生成网络的参数进行精调； (4)利用第二次训练好的区域生成网络，保持特征提取网络的参数保持不变，根据生成的候选框，第二次训练Fast RCNN网络，精调Fast RCNN网络中自己的参数。权　利　要　求　书 2/3 页 3 CN 114693657 A 3

专利 基于Faster R-CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法及系统

专利基于Faster R-CNN的大型复杂结构件表面多尺寸多类别缺陷智能检测方法及系统