(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210420891.0
(22)申请日 2022.04.21
(71)申请人 杭州电子科技大 学
地址 310018 浙江省杭州市钱塘新区白杨
街道2号大街1 158号
(72)发明人 周晓飞 王涛 张继勇 李世峰
(51)Int.Cl.
G06V 10/26(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种模仿人类视觉系统对伪装目标检测与
分割方法
(57)摘要
本发明公开了一种模仿人类视觉系统对伪
装目标检测与分割方法, 该包括如下步骤: S1、 制
作预训练数据集; S2、 构建基于模仿人类视觉系
统对伪装目标检测与分割的模型, 所述模型包括
编码器模块、 桥接模块、 邻域连接解码器模块和
部分解码器模块; S3、 通过编码器模块提取显著
性信息; S4、 通过桥接模块扩大全局感受野; S5、
通过领域连接解码器模块生成粗糙位置图; S6、
通过部分解码器模块生成精确的位置图; S7、 训
练构建好的基于模仿人类视觉系统对伪装目标
检测与分割模型。 方法主要由编码器模块, 桥接
模块, 邻域连接解码器模块和部分解码器模块组
成, 通过对神经网络进行训练, 得到最优参数, 实
现对伪装目标的自动检测与分割。
权利要求书2页 说明书6页 附图2页
CN 114627299 A
2022.06.14
CN 114627299 A
1.一种模仿人类视 觉系统对伪装目标检测与分割方法, 其特 征在于, 包括如下步骤:
S1、 制作预训练数据集;
S2、 构建基于模仿人类视觉系统对伪装目标检测与分割的模型, 所述模型包括编码器
模块、 桥接模块、 邻域连接解码器模块和部分解码器模块;
S3、 通过编码器模块 提取显著性信息;
S4、 通过桥接模块扩大全局感受野;
S5、 通过邻域连接解码器模块 生成粗糙位置图;
S6、 通过部分解码器模块 生成精确的位置图;
S7、 训练构建好的基于模仿人类视 觉系统对伪装目标检测与分割模型。
2.根据权利要求1所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述编码器模块包括34个基本块, 每个所述基础块包括一个残差支路和短接支路, 所述桥
接模块包括3层基础层, 每一层所述基础层由3 ×3的膨胀卷积层、 BN层和ReLU函数组成, 所
述邻域连接解码器为聚合特征金字塔结构, 所述邻域连接解码器模块包括上采样、 3 ×3的
卷积层、 BN层和拼接, 所述部分解码器模块包括卷积层、 BN层和ReLU激活函数, 所述部分解
码器模块的结构与邻域连接解码器结构类似, 为聚合特 征金字塔结构。
3.根据权利要求2所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述步骤S3的具体方法: 使用预训练数据提取5层特征 ƒi(i=1,2,3,4,5), ƒ1和ƒ2为低级
语义特征, 包括图像的颜色、 亮度, ƒ3、ƒ4和ƒ5层为高级语义特征, 包括图像的纹理、 位置、
上下文内容。
4.根据权利要求3所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述步骤S4的具体方法: 仅对步骤S3提 取的ƒ3,ƒ4,ƒ5层特征进行桥接处理, 通过模 仿人眼
的全局观测能力, 着重观察全局信息, 得到
, 以进一步扩大模型对该3层全局感
受野。
5.根据权利要求4所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述步骤S5的具体方法: 模仿人眼对
3个信息进行初步处理, 其具体操作是将高
级特征与低级 特征逐层进 行逐元素相乘并拼接, 用于保持层内的语义一致性并跨层拼接上
下文信息, 定位隐藏对象, 生成粗 糙的位置图。
6.根据权利要求5所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述步骤S6的具体方法: 将输出的粗糙位置图通过部 分解码器模块逐元素相乘并与上层特
征进行拼接处 理。
7.根据权利要求1 ‑6任意一项所述的模仿人类视觉系统对伪装目标检测与分割方法,
其特征在于, 所述步骤S7的具体方法: 训练过程中, 分别对由编码 器模块、 桥接模块、 邻域连
接解码器模块和部 分解码器模块得到的结果进行监督, 将结果通过双线性插值上采样进 行
放大, 使其与输入数据具有相同的尺寸, 后经过sigmoid函数将结果映射至0 ‑1, 得到预测
图, 通过对比预测图与GT图的差异, 观测4个损失值的和是否收敛来判断网络的训练过程。
8.根据权利要求7所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述步骤S3中, 使用由34个基本块组成编码器, 导入预训练数据, 提取5层特征 ƒi(i=1,2,权 利 要 求 书 1/2 页
2
CN 114627299 A
23,4,5),各层特征之间以最大池化的下采样连接, 输出信息尺寸分别为原图像的1/1, 1/2,
1/4, 1/8和1/16, 通道数分别为64,128,25 6,512,512。
9.根据权利要求7所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于,
所述步骤S7中输入数据的尺寸统一调整为224 ×224×3, 批处理大小设置为8, 在训练过程
中利用Adam优化器对 模型参数进行 更新操作, 初始学习率设置为1e ‑3。权 利 要 求 书 2/2 页
3
CN 114627299 A
3
专利 一种模仿人类视觉系统对伪装目标检测与分割方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:34:52上传分享