安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210296395.9 (22)申请日 2022.03.24 (71)申请人 中国人民解 放军海军大连舰艇学院 地址 116018 辽宁省大连市中山区解 放路 667号 (72)发明人 蒋永馨 邹勤 毕京强 彭鹏  张志友 郑振宇 吴明 金鑫  曹延哲  (74)专利代理 机构 大连智高专利事务所(特殊 普通合伙) 2123 5 专利代理师 马庆朝 (51)Int.Cl. G06V 20/10(2022.01) G06V 20/40(2022.01) G06V 10/80(2022.01)G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于多尺度信息融合的海面小目标检测方 法、 电子设备及计算机可读介质 (57)摘要 基于多尺度信息融合的海面小目标检测方 法、 电子设备及计算机可读介质, 属于人工智能 和计算机视觉领域。 构建海面小目标仿真数据 集; 构建深度学习网络模型; 利用小目标仿真数 据集对构建的深度学习模型进行训练; 在训练过 程中, 通过transformer模块解码和检测出海面 小目标的位置和类别信息; 利用训练好的模型进 行其他场景下的海面小目标检测。 本发明创新性 使用自上而下的tran sformer解码策略, 对FPN中 自上而下的不同尺度特征图采用可变形卷积的 方式实现encoder中的自注意力机制, 同时从高 层的较小特征层开始通过在相邻两个特征层之 间引入transformer模块进行解码预测边界框, 自上而下通过不断引入包含更多小目标信息的 低层特征来不断进行边界框修正, 进而提高小目 标检测准确率。 权利要求书3页 说明书9页 附图2页 CN 114943888 A 2022.08.26 CN 114943888 A 1.一种基于多尺度信息融合的海面小目标检测方法, 其特 征在于, 步骤如下: 步骤S1, 构建海面小目标仿真数据集: 利用嵌入轨迹规划方法和无缝融合方法, 使用所 述数据集将船只渲染到场景中, 从而根据嵌入位置标注得到准确的边界框和类别 信息; 步骤S2, 构建深度学习网络模型, 所述模型包括主干网络、 FPN网络、 自上而下的 transformer网络; 所述主干网络用于特征提取, 抽取所述主干网络的特征层并构建FPN网 络用于多尺度特征融合, 并且嵌入transformer模块, 利用自上而 下的解码方式使网络进一 步加强关注小目标区域; 其中使用可变形 卷积实现t ransformer模块的注意力机制; 步骤S3, 利用步骤S1构建的小目标仿真数据集对步骤S2构建的深度学习模型进行训 练; 在训练过程中, 通过t ransformer模块 解码和检测出海面小目标的位置和类别 信息; 步骤S4, 利用步骤S3训练好的模型进行其 他场景下的海面小目标检测。 2.根据权利要求1所述的基于多尺度信 息融合的海面小目标检测方法, 其特征在于, 所 述步骤S1具体为: 步骤S1‑1, 收集M幅真实的不同种类的船只图像和N个不同天气状况 下的海面视频; 步骤S1‑2, 海平面嵌入轨迹规划: 针对每个海面视频, 每间隔1s抽取其中一个视频帧, 针对每个视频帧的海平面等间隔采集多个采样点, 并根据视频海平面的起伏程度选择T次 多项式, 利用T次多项式曲线拟合的方式拟合完整海平 面, 该多项式含有T+1个参数; 在得到 整个海面视频的所有T次多项式拟合曲线后, 针对多项式的每一项系数以时间为横坐标, 系 数为纵坐标同样使用多项式进 行曲线拟合; 总共得到T+1个参数拟合曲线; 通过上述步骤得 到系数随时间变化的T次多 项式海面拟合曲线; 步骤S1‑3, 针对每个海面场景视频, 给定嵌入船只的初始位置和移动 速度; 对每个视频 帧, 根据时间标签计算船只在每个海平面视频帧图像中的横坐标, 并利用当前视频帧对应 的时间求得T次多项式的当前系数, 得到 当前视频帧的海平 面拟合曲线, 进而根据横坐标计 算出纵坐标, 从而得到每帧视频图像的船只嵌入位置; 步骤S1‑4, 船只与海面的无缝融合: 针对嵌入的图片, 利用高斯滤波对前景船只图片进 行模糊处理, 之后 将船只缩小, 将得到的模糊小尺寸图片嵌入到步骤S1 ‑3生成的位置, 并在 嵌入后再次使用高斯滤波对边 缘进行平 滑; 步骤S1‑5, 针对每个视频帧, 以步骤S1 ‑3中得到的每个视频帧的嵌入位置为 中心, 将步 骤S1‑4中得到的结果图片逐帧嵌入到海面场景图像; 利用前景目标图像插入的位置和缩放 后的大小构建目标检测的标注框; 步骤S1‑6, 针对每个海面视频, 重复步骤S1 ‑2到步骤S1 ‑5, 从而构建完整的海面小目标 数据集。 3.根据权利要求1所述的基于多尺度信 息融合的海面小目标检测方法, 其特征在于, 所 述构建深度学习网络为 一个多尺度信息融合的端到端网络; 所述 步骤S2具体为: 步骤S2‑1, 通过所述主干网络对图片进行 特征提取; 步骤S2‑2, 将得到的多个不同尺度feature  map输入FPN网络进行多尺度信息融合; 步骤S2‑3, 将经过融合的多层feature  map输入级联transformer模块进行反向解码, 得到高精度的类别预测和边界框预测结果; 所述tr ansformer模块利用可变形卷积形成注 意力机制, 其中, transformer模块的decoder利用不同尺度特征图实现跨层注意力, 同时利 用自上而下的方式进行解码。权 利 要 求 书 1/3 页 2 CN 114943888 A 24.根据权利要求1所述的基于多尺度信 息融合的海面小目标检测方法, 其特征在于, 所 述步骤S2中主干网络使用ResNet ‑50为基准网络 。 5.根据权利要求3所述的基于多尺度信 息融合的海面小目标检测方法, 其特征在于, 在 步骤S2‑3中, 将得到的不同尺度特 征输入分类分支, 使用交叉熵损失作为分类损失: 其中, Lcls(x,c)表示分类学习损失, i表示预测框序号, Pos表示预测为正样本, n表示预 测框的总 个数, p表示类别, j表示真实框序号, 表示第i个预测框与第j个真实框匹配, 取 值为{0,1}, 表示第i个预测框关于类别p的概率, Neg表示预测为负样本, 表示第i个预 测框关于背景类的置信度, 表示预测类别为p的置信度。 6.根据权利要求3所述的基于多尺度信 息融合的海面小目标检测方法, 其特征在于, 在 步骤S2‑3中, 将得到的不同尺度特征输入边界框预测分支, 使用SmoothL1损失作为边界框 回归损失: 其中, Lloc(x,l,g)表示边界框预测损失, 边界框中心为(cx, cy), 宽高分别为w和h, m表 示表示边界框的每个参数, k表示类别, 代表第i个预测框与第j个真实框关于类别k是否 匹配, 为预测框, 为真实框, 表示第j个真实框中心 点的横坐标与第i个预测框初始 锚框中心的横坐标的相对偏移量, 表示第j个真实框中心点的横坐标, 表示第i个预 测框初始锚框中心的横坐标, 表示第j个真实框中心点的横坐标与第i个预测框初始锚 框中心的纵坐标的相对偏移量, 表示第j个真实框中心点的纵坐标, 表示第i个预测 框初始锚框的纵坐标, 表示第j个真实框的宽与第i个预测框初始锚框的宽的相对大小, 表示第j个真实框的宽, 表示第i个预测框初始锚框的宽, 表示第j个真实框的高与 第i个预测框初始锚框的高的相对大小, 表示第j个真实框的高, 表示第i个预测框初 始锚框的高。 7.根据权利要求5或6所述的基于多尺度信息融合的海面小目标检测方法, 其特征在权 利 要 求 书 2/3 页 3 CN 114943888 A 3

.PDF文档 专利 基于多尺度信息融合的海面小目标检测方法、电子设备及计算机可读介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多尺度信息融合的海面小目标检测方法、电子设备及计算机可读介质 第 1 页 专利 基于多尺度信息融合的海面小目标检测方法、电子设备及计算机可读介质 第 2 页 专利 基于多尺度信息融合的海面小目标检测方法、电子设备及计算机可读介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:37:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。