(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210580683.7
(22)申请日 2022.05.26
(71)申请人 杭州电子科技大 学
地址 310018 浙江省杭州市钱塘新区白杨
街道2号大街1 158号
申请人 中电数据服 务有限公司
(72)发明人 周晓飞 王灵波 张继勇 李世锋
周振 何帆 颜成钢
(51)Int.Cl.
G06V 10/72(2022.01)
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06V 10/774(2022.01)
G06V 10/44(2022.01)
G06V 10/46(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于编解码架构的渐进式显著目标识
别方法
(57)摘要
本发明公开了一种基于编解码架构的渐进
式显著目标识别方法, 包括如下步骤: S1、 图像数
据预处理, 并将预处理后的图像数据制作成训练
集; S2、 搭建目标识别网络并获取精确显著图像;
S3、 训练集中的 图像数据输入至目标识别网络并
训练。 本发明通过在网络编码过程、 解码过程中
采用不同的渐进融合方式, 有效减少了层间、 尤
其是间隔层之间的噪声污染保证了多尺度特征
信息的有效利用, 另外, 通过渐进式连接方法取
代传统模型中的简单跳跃连接、 长连接, 在保证
多尺度特征信息能有效传递的同时, 对不同特征
层间的噪声信息进行筛除、 提纯, 使得伪装图像
的显著目标检测模型性能得到巨大提升 。
权利要求书2页 说明书5页 附图2页
CN 115019068 A
2022.09.06
CN 115019068 A
1.一种基于编解码架构的渐进式显著目标识别方法, 其特 征在于, 包括如下步骤:
S1、 图像数据预处 理, 并将预处 理后的图像数据制作成训练集;
S2、 搭建目标识别网络并获取精确显著图像
S2‑1、 搭建编码网络、 渐进融合模块、 感受野块和解码网络, 其中, 编码网络采用
ResNet‑34作为主干网络, 所述编码网络的第一层, 输入的图像数据不经过池化操作直接输
入至编码网络,
S2‑2、 将编码网络与3个结构相同的渐进融合模块进行连接, 并通过渐进融合模块获取
图像数据的特 征信息,
S2‑3、 3个渐进融合模块处 理后得到的图像数据的特 征信息分别输入3个感受野块,
S2‑4、 通过解码网络对经感受野块处 理的特征信息进行解码, 输出精确显著图像;
S3、 训练集中的图像数据输入至目标识别网络并训练。
2.根据权利要求1所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述图像数据的预处理方法为: 对噪声明显的图像数据进行筛除, 对数据集中不同图像类别
进行分类, 分类的类别包括伪装目标类、 非伪装目标类以及背景图像。
3.根据权利要求1所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述ResNet ‑34包括5个编码块, 5个所述编码块中的任意三个组成一组分别输入至渐进融合
模块。
4.根据权利要求3所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述渐进融合模块整体为残差结构, 所述渐进融合模块包括初卷积块、 适应卷积块、 挖掘卷积
块和输出卷积块, 所述初卷积块、 适应卷积块、 挖掘卷积块和输出卷积块均由3个3 ×3卷积、
批标准化、 ReLU激活函数复合层构成。
5.根据权利要求4所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述渐进融合模块获取图像数据的特 征信息的方法为:
通过初卷积块进一 步提取对应编码块的特 征信息;
通过适应卷积块调整各支路的特征信息的尺度使得各支路特征信息能够实现元素级
相加后输入 对应的挖掘卷积块中;
通过挖掘卷积块对调整后的不同尺度特 征信息进行进一 步挖掘;
通过输出卷积块调整使得渐进融合模块输出的特征尺度与中间层的编码块输入特征
相同。
6.根据权利要求1所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述解码网络包络部分解码块和渐进解码块, 所述渐进解码块包括Convblock1卷积块、
Convblock2卷积块、 Convblock3卷积块, 其均有3个3 ×3卷积、 批标准化、 ReLU激活函数复合
层构成。
7.根据权利要求6所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述解码网络的解码方法为:
通过部分解码块对3条感受野块的输出 特征进行部分解码, 从而获得粗 糙的显著图片;
而后通过插片操作后, 将粗糙的显著图片进行复制, 增加其通道数, 与对应感受野块的
输出特征进行连接, 复制的通道数与该感受野块输出 特征通道数相同;
送入对应的卷积块输出最终的精确显著图片。权 利 要 求 书 1/2 页
2
CN 115019068 A
28.根据权利要求7所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述解码网络还 包括多级监督模块, 用于对部分解码块的输出、 渐进解码块的输出加以监 督。
9.根据权利要求8所述的基于编 解码架构的渐进式显著目标识别方法, 其特征在于, 所
述多级监督模块采用BC E、 IoU、 SSIM混合损失函数进行监 督。
10.根据权利要求1 ‑9任意一项所述的基于编 解码架构的渐进式显著目标识别方法, 其
特征在于, 所述目标识别网络的训练方法为: Adam优化器, 学习率设置为0.001, beta=
(0.9,0.999),eps=1e ‑8,weight _decay=0, 并且输入图像resize为2 56*256, epoch设置为
400, batch size为8。权 利 要 求 书 2/2 页
3
CN 115019068 A
3
专利 一种基于编解码架构的渐进式显著目标识别方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:06:40上传分享