(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210413768.6
(22)申请日 2022.04.19
(71)申请人 安徽理工大 学
地址 232000 安徽省淮南市山 南新区泰丰
大街168号
(72)发明人 夏晨星 孙延光 高修菊 段松松
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06V 10/77(2022.01)
G06V 10/46(2022.01)
G06V 10/44(2022.01)
G06V 10/42(2022.01)
G06N 3/04(2006.01)
G06K 9/62(2022.01)
(54)发明名称
基于渐进收缩和循环交互网络的显著性目
标检测算法
(57)摘要
本发明属于计算机视觉领域, 提供了一种基
于渐进收缩和循环交互网络的显著性目标检测
算法, 包括以下步骤: 1)利用预训练好的ResNet ‑
50网络作为主干网络提取初始多层次特征; 2)利
用多尺度上下文注意力模块捕获局部和全局上
下文注意力信息, 然后通过聚合这些信息增加初
始多层次特征中的显著性目标信息; 3)利用相邻
特征收缩与交互模块将优化后的多层次特征逐
渐压缩和交互生成高质量特征表示; 4)利用降维
操作和Sigmoid函数将生成的高质量表示进行降
维激活预测初始显著性图, 并利用混合损失函数
训练此模型。 大量的在多个公开的数据集上的实
验数据表明了, 此发明具有高效性和优 越性。
权利要求书2页 说明书5页 附图2页
CN 114863208 A
2022.08.05
CN 114863208 A
1.基于渐进收缩和循环交互网络的显著性目标检测算法, 其特征在于, 该方法包括以
下步骤:
1)输入RGB图像, 利用预训练好的ResNet ‑50网络作为主干网络提取初始多层次特 征;
2)基于多尺度上下文注意力模块, 利用多个轻量级的卷积操作和通道注意力权重矩阵
来捕获局部和全局上 下文注意力特 征, 用于强化初始多层次特 征的性能。
3)基于相邻特征收缩与交互模块, 利用相邻特征收缩策略和循环 交互策略来逐渐减少
多层次特 征的数量和补全多层次特 征的信息进 而生成高质量特 征表示;
4)基于高质量特征表示, 利用降维和激活操作来生成初始显著性图, 并利用混合损失
函数进行监 督训练。
2.根据权利要求1所述的基于渐进收缩和循环交互网络的显著性目标检测算法, 其特
征在于: 所述 步骤1)具体方法是:
2.1)收集显著性目标检测领域相关数据集, 包括DUTS数据集, DUT ‑OMRON数据集, HKU ‑
IS数据集, PASCAL ‑S数据集和E CSSD数据集。
2.2)此发明, 利用具有10553张图像 的DUTS数据集作为训练数据集, 用于训练模型; 利
用DUTS‑TE, DUT‑OMRON, HKU‑IS, PASCAL ‑S和ECSSD数据集作为测试数据集, 用于检测模型泛
化性能。
2.3)输入DUTS数据集, 利用预训练好的ResNet ‑50网络提取五个初始多层次特征, 并对
特征进行编码U={U1,U2,U3,U4,U5}。
3.根据权利要求1所述的基于渐进收缩和循环交互网络的显著性目标检测算法, 其特
征在于: 所述 步骤2)具体方法是:
3.1)首先, 我们在每个多层次特征U上使用了一个1 ×1卷积核的卷积层、 一个批处理规
范化(BN)和一个ReLU激活函数来进行降维, 使得每 个特征的通道数为128。
3.2)随后, 我们采用多个不 同扩张率(即0,2,4,6)的扩张深度可分离卷积来捕获多感
受野的上下文信息Mi, 引入了侧连接来强化不 同尺度的上下文信息具有相关性。 相关公式
如下所示:
这里,
表示分支第i分支的深度可分离卷积运算, γ表示降维运算, 其中包含一个包
含1×1×128卷积核的卷积层、 一个批处 理归一化(BN)和一个ReLU激活函数。
3.3)之后, 我们试图利用捕捉到的多尺度上下文信息, 学习不同的注意里矩阵, 以选择
更有用的信息 。 即,
其中, σ 表示sigmoid激活函数, F1和F2是两个全连接层, τ表示ReLU激活函数, GAP表示全
局平均池操作。 通过注意权重矩阵
可以有效地增强多尺度上下文特征中不同通道的显
著性目标信息 。 其数学公式如下:
这里,
表示第i个分支的
和*是元素级乘法运 算。权 利 要 求 书 1/2 页
2
CN 114863208 A
23.4)最后, 不同尺度下的上下文注意力特征信息通过一个单一的特征拼接操作进行聚
合, 此外我们还并引入剩余连接来生成具有丰富显著性信息的特征O={O1, O2, O3, O4, O5},
即,
这里, γ表示降维操作, Cat 表示特征拼接操作, +表示元 素相加。
4.根据权利要求1所述的基于渐进收缩和循环交互网络的显著性目标检测算法, 其特
征在于: 所述 步骤3)具体方法是:
4.1)首先, 我们采用相邻特征组合的方式减少多层特征的数量, 使五个子层特征逐渐
减少为三个子层特 征。 生成特 征T={T1, T2, T3}, 其可以表示 为:
Ti=Oi+2+Oi+1+Oi, i=1, 2, 3 (5)
这里, +表示元 素级相加操作。
4.2)随后, 考虑到不同层次特征的互补性, 我们通过循环交互策略对多层次特征T进行
交互, 即,
其中,
表示第n层次的交 互后的多层次特 征, +表示元 素级加法操作。
4.3)最后, 我们聚合了多层次特征
此外, 为了进一步增加语义信息和空间细节信
息, 我们再次引入最高层次特征 O5和最低层次特征 O1, 以生成高质量的特征表示P。 整个过程
公式如下:
5.根据权利要求1所述的基于渐进收缩和循环交互网络的显著性目标检测算法, 其特
征在于: 所述 步骤4)具体方法是:
5.1)对于生成的高质量特征表示, 我们利用了一个1 ×1卷积层和sigmoid激活函数来
生成初始显著性图。 为了获得具有尖锐边界的显著性图, 利用一个混合损失函数来训练监
督我们的模型, 混合损失函数定义 为:
这里,
和
分别表示 二进制交叉熵损失函数和I oU损失函数。权 利 要 求 书 2/2 页
3
CN 114863208 A
3
专利 基于渐进收缩和循环交互网络的显著性目标检测算法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:06:48上传分享