安全公司报告
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210365378.6 (22)申请日 2022.04.08 (65)同一申请的已公布的文献号 申请公布号 CN 114445430 A (43)申请公布日 2022.05.06 (73)专利权人 暨南大学 地址 510632 广东省广州市天河区黄埔大 道西601号 (72)发明人 石敏 沈佳林 易清明 骆爱文  戴国帅  (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 专利代理师 林丽明 (51)Int.Cl. G06T 7/11(2017.01)G06V 10/26(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (56)对比文件 CN 112330681 A,2021.02.0 5 审查员 洪汇隆 (54)发明名称 轻量级多尺度特征融合的实时图像语义分 割方法及系统 (57)摘要 本发明提出一种轻量级多尺度特征融合的 实时图像语义分割方法, 包括: 构建包括初始化 模块、 分离 ‑提取‑合并瓶颈模块、 分区 ‑融合通道 注意力模块、 特征融合模块和多尺度注意力解码 器的图像语义分割网络。 通过图像语义分割网络 提取待处理图像初始特征图的多尺度特征, 得到 多尺度特征图; 提取并融合初始特征图的全局通 道信息和局部通道信息, 得到通道信息特征图; 将多尺度特征图、 通道信息特征图和原始的待处 理图像进行特征融合, 得到融合特征图; 基于融 合特征图进行图像精度恢复, 得到图像语义分割 结果。 本发 明能够在参数量相对较小的轻量级图 像语义分割网络模型中保证模型的精度和准确 率, 提高模型的推理速度, 实现图像的实时语义 分割。 权利要求书4页 说明书18页 附图7页 CN 114445430 B 2022.06.21 CN 114445430 B 1.轻量级 多尺度特 征融合的实时图像 语义分割方法, 其特 征在于, 包括以下步骤: S1: 构建图像语义分割网络, 所述图像语义分割网络包括初始化模块、 分离 ‑提取‑合并 瓶颈模块、 分区 ‑融合通道注意力模块、 特征融合模块和多尺度 注意力解码 器; 所述分离 ‑提 取‑合并瓶颈模块包括若干个依次连接的分离 ‑提取‑合并瓶颈结构; S2: 将待处理图像输入所述图像语义分割网络, 图像语义分割网络输出图像语义分割 结果; 其中, 所述初始化模块对待处理图像进行特征提取, 得到待处理图像的初始特征图, 具 体包括以下步骤: 将待处理图像经 过卷积层进行 卷积操作, 得到第一特 征图; 将所述第 一特征图与原始的待处理图像进行并行拼接, 将拼接结果经过一个1 ×1卷积 层进行卷积操作后, 得到第二特 征图; 所述分离 ‑提取‑合并瓶颈模块采用分离特征通道提取初始特征图的多尺度特征, 得到 多尺度特 征图, 具体包括以下步骤: 将第二特征图输入第 一个分离 ‑提取‑合并瓶颈结构, 所述第二特征图经过一个3 ×3的 标准卷积层进 行卷积操作后, 将卷积操作结果通过通道分离生成两个特征图分别经过一个 3×3的深度可分离卷积层和经 过一个3×3的深度可分离空洞卷积层进行 卷积操作; 将两个卷积操作结果进行合并, 然后将合并结果经过一个3 ×3的标准卷积层进行卷积 操作后与输入当前分离 ‑提取‑合并瓶颈结构的特征图进行特征映射, 将特征映射结果输入 下一个分离 ‑提取‑合并瓶颈结构进行处 理; 经过若干个分离 ‑提取‑合并瓶颈结构处 理后, 得到多尺度特 征图; 所述分区 ‑融合通道注意力模块提取并融合初始特征图的全局通道信 息和局部通道信 息, 得到通道信息特 征图; 所述特征融合模块将多尺度 特征图、 通道信 息特征图和 原始的待处理图像进行特征融 合, 得到融合特 征图; 所述多尺度注意力解码器基于融合特征图进行图像精度恢复, 得到图像语义分割结 果。 2.根据权利要求1所述的轻量级多尺度特征融合的实时图像语义分割方法, 其特征在 于, 在一个 分离‑提取‑合并瓶颈结构中, 所述3 ×3的标准卷积层、 3 ×3的深度可分离卷积层 和3×3的深度可分离空洞卷积层的输出端均依次连接有PReLU激活层和BN层。 3.根据权利要求1所述的轻量级多尺度特征融合的实时图像语义分割方法, 其特征在 于, 所述分区 ‑融合通道注意力模块包括全局注 意力生成支路和局部注意力融合支路; 所述 分区‑融合通道注意力模块提取并融合初始特征图的全局 通道信息和局部通道信息, 得到 通道信息特 征图的步骤 包括: 将所述分离 ‑提取‑合并瓶颈模块中第一个分离 ‑提取‑合并瓶颈结构输出的特征图A输 入分区‑融合通道注意力模块后分别进入 全局注意力生成支路和 局部注意力融合支路; 对输入全局注意力生成支路的特征图A1进行全局平均池化并学习特征图A1的通道权 值, 得到学习特 征图A1的全局通道信息; 对输入局部注意力融合支路的特征图A2进行分区处理, 将特征图A2分为k个区域; 对特 征图A2的k个区域分别进行全局 平均池化并学习k个区域的平均池化值, 得到特征图A2的局权 利 要 求 书 1/4 页 2 CN 114445430 B 2部通道信息; 将所述全局通道信 息和所述局部通道信 息进行加权 融合, 根据加权 融合结果对输出特 征图进行 特征提取, 得到通道信息特 征图。 4.根据权利要求3所述的轻量级多尺度特征融合的实时图像语义分割方法, 其特征在 于, 所述特征融合模块将多尺度特征图、 通道信息特征图和原始的待处理图像进行特征融 合, 得到融合特 征图的步骤 模块的步骤 包括: 所述特征融合模块对多尺度 特征图、 通道信 息特征图和 原始的待处理图像进行通道方 向上的拼接, 将拼接结果经 过一个1×1卷积层进行 卷积操作, 得到融合特 征图。 5.根据权利要求1所述的轻量级多尺度特征融合的实时图像语义分割方法, 其特征在 于, 将待处 理图像经 过卷积层进行 卷积操作, 得到第一特 征图的步骤 包括: 将待处理图像输入初始化模块, 待处理图像经过一个步长为2的3 ×3的标准卷积层进 行卷积操作, 然后将卷积操作连续经过两个3 ×3的标准卷积层进行卷积操作, 得到第一特 征图。 6.根据权利要求1所述的轻量级多尺度特征融合的实时图像语义分割方法, 其特征在 于, 所述分离 ‑提取‑合并瓶颈模块包括第一分离 ‑提取‑合并瓶颈模块和第二分离 ‑提取‑合 并瓶颈模块; 所述分区 ‑融合通道注 意力模块包括第一分区 ‑融合通道注意力模块和 第二分 区‑融合通道注意力模块; 所述特征融合模块包括第一特征融合模块和第二特征融合模块; 则将待处理图像输入图像语义分割网络, 图像语义分割网络输出图像语义分割结果的步骤 包括: 将待处理图像经过卷积层进行卷积操作, 得到第一特征图; 将所述第一特征图与原始 的待处理图像进行并行拼接特 征融合得到第二特 征图; 将所述第 二特征图进行下采样后输入第一分离 ‑提取‑合并瓶颈模块, 第 二特征图经过 若干个分离 ‑提取‑合并瓶颈结构进行多尺度特征提取, 得到第一多尺度特征图; 将第一分 离‑提取‑合并瓶颈模块中的第一个分离 ‑提取‑合并瓶颈结构的输出特征图传输至第一分 区‑融合通道注意力模块, 所述第一分区 ‑融合通道注意力模块提取并融合所述输出特征图 的全局通道信息和局部通道信息, 得到第一通道信息特征图; 将所述第一多尺度特征图、 第 一通道信息特征图和待处理的原始图像输入第一特征融合模块, 第一特征融合模块将第一 多尺度特征图、 第一通道信息特征和原始的待处理图像进行特征融合, 得到第一融合特征 图; 将所述第 一融合特征图进行一 次下采样后输入第 二分离‑提取‑合并瓶颈模块, 第一融 合特征图经过若干个分离 ‑提取‑合并瓶颈结构进 行多尺度特征提取, 得到第二多尺度特征 图; 将第二分离 ‑提取‑合并瓶颈模块中的第一个分离 ‑提取‑合并瓶颈结构的输出特征图传 输至第二分区 ‑融合通道注意力模块, 所述第二分区 ‑融合通道注 意力模块提取并融合所述 输出特征图的全局 通道信息和局部通道信息, 得到第二通道信息特征图; 将所述第二多尺 度特征图、 第二通道信息特征图和原始的待处理图像输入第二特征融合模块, 第二特征融 合模块将第二多尺度特征图、 第二通道信息特征和原始的待处理图像进行特征融合, 得到 第二融合特 征图; 将所述第一融合特征图和第 二融合特征图输入所述多尺度注意力解码器, 多尺度注意 力解码器根据第一融合特征图和 第二融合特征图进行图像精度恢复, 得到图像语义分割结权 利 要 求 书 2/4 页 3 CN 114445430 B 3

PDF文档 专利 轻量级多尺度特征融合的实时图像语义分割方法及系统

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 轻量级多尺度特征融合的实时图像语义分割方法及系统 第 1 页 专利 轻量级多尺度特征融合的实时图像语义分割方法及系统 第 2 页 专利 轻量级多尺度特征融合的实时图像语义分割方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。