专利 一种模仿人类视觉系统对伪装目标检测与分割方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210420891.0 (22)申请日 2022.04.21 (71)申请人杭州电子科技大学地址 310018 浙江省杭州市钱塘新区白杨街道2号大街1 158号 (72)发明人周晓飞　王涛　张继勇　李世峰　 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种模仿人类视觉系统对伪装目标检测与分割方法 (57)摘要本发明公开了一种模仿人类视觉系统对伪装目标检测与分割方法，该包括如下步骤： S1、制作预训练数据集； S2、构建基于模仿人类视觉系统对伪装目标检测与分割的模型，所述模型包括编码器模块、桥接模块、邻域连接解码器模块和部分解码器模块； S3、通过编码器模块提取显著性信息； S4、通过桥接模块扩大全局感受野； S5、通过领域连接解码器模块生成粗糙位置图； S6、通过部分解码器模块生成精确的位置图； S7、训练构建好的基于模仿人类视觉系统对伪装目标检测与分割模型。方法主要由编码器模块，桥接模块，邻域连接解码器模块和部分解码器模块组成，通过对神经网络进行训练，得到最优参数，实现对伪装目标的自动检测与分割。权利要求书2页说明书6页附图2页 CN 114627299 A 2022.06.14 CN 114627299 A 1.一种模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，包括如下步骤： S1、制作预训练数据集； S2、构建基于模仿人类视觉系统对伪装目标检测与分割的模型，所述模型包括编码器模块、桥接模块、邻域连接解码器模块和部分解码器模块； S3、通过编码器模块提取显著性信息； S4、通过桥接模块扩大全局感受野； S5、通过邻域连接解码器模块生成粗糙位置图； S6、通过部分解码器模块生成精确的位置图； S7、训练构建好的基于模仿人类视觉系统对伪装目标检测与分割模型。 2.根据权利要求1所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述编码器模块包括34个基本块，每个所述基础块包括一个残差支路和短接支路，所述桥接模块包括3层基础层，每一层所述基础层由3 ×3的膨胀卷积层、 BN层和ReLU函数组成，所述邻域连接解码器为聚合特征金字塔结构，所述邻域连接解码器模块包括上采样、 3 ×3的卷积层、 BN层和拼接，所述部分解码器模块包括卷积层、 BN层和ReLU激活函数，所述部分解码器模块的结构与邻域连接解码器结构类似，为聚合特征金字塔结构。 3.根据权利要求2所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S3的具体方法：使用预训练数据提取5层特征 ƒi(i=1,2,3,4,5)， ƒ1和ƒ2为低级语义特征，包括图像的颜色、亮度， ƒ3、ƒ4和ƒ5层为高级语义特征，包括图像的纹理、位置、上下文内容。 4.根据权利要求3所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S4的具体方法：仅对步骤S3提取的ƒ3,ƒ4,ƒ5层特征进行桥接处理，通过模仿人眼的全局观测能力，着重观察全局信息，得到，以进一步扩大模型对该3层全局感受野。 5.根据权利要求4所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S5的具体方法：模仿人眼对 3个信息进行初步处理，其具体操作是将高级特征与低级特征逐层进行逐元素相乘并拼接，用于保持层内的语义一致性并跨层拼接上下文信息，定位隐藏对象，生成粗糙的位置图。 6.根据权利要求5所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S6的具体方法：将输出的粗糙位置图通过部分解码器模块逐元素相乘并与上层特征进行拼接处理。 7.根据权利要求1 ‑6任意一项所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S7的具体方法：训练过程中，分别对由编码器模块、桥接模块、邻域连接解码器模块和部分解码器模块得到的结果进行监督，将结果通过双线性插值上采样进行放大，使其与输入数据具有相同的尺寸，后经过sigmoid函数将结果映射至0 ‑1，得到预测图，通过对比预测图与GT图的差异，观测4个损失值的和是否收敛来判断网络的训练过程。 8.根据权利要求7所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S3中，使用由34个基本块组成编码器，导入预训练数据，提取5层特征 ƒi(i=1,2,权　利　要　求　书 1/2 页 2 CN 114627299 A 23,4,5),各层特征之间以最大池化的下采样连接，输出信息尺寸分别为原图像的1/1， 1/2， 1/4， 1/8和1/16，通道数分别为64,128,25 6,512,512。 9.根据权利要求7所述的模仿人类视觉系统对伪装目标检测与分割方法，其特征在于，所述步骤S7中输入数据的尺寸统一调整为224 ×224×3，批处理大小设置为8，在训练过程中利用Adam优化器对模型参数进行更新操作，初始学习率设置为1e ‑3。权　利　要　求　书 2/2 页 3 CN 114627299 A 3

专利 一种模仿人类视觉系统对伪装目标检测与分割方法

专利一种模仿人类视觉系统对伪装目标检测与分割方法