安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210420891.0 (22)申请日 2022.04.21 (71)申请人 杭州电子科技大 学 地址 310018 浙江省杭州市钱塘新区白杨 街道2号大街1 158号 (72)发明人 周晓飞 王涛 张继勇 李世峰  (51)Int.Cl. G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种模仿人类视觉系统对伪装目标检测与 分割方法 (57)摘要 本发明公开了一种模仿人类视觉系统对伪 装目标检测与分割方法, 该包括如下步骤: S1、 制 作预训练数据集; S2、 构建基于模仿人类视觉系 统对伪装目标检测与分割的模型, 所述模型包括 编码器模块、 桥接模块、 邻域连接解码器模块和 部分解码器模块; S3、 通过编码器模块提取显著 性信息; S4、 通过桥接模块扩大全局感受野; S5、 通过领域连接解码器模块生成粗糙位置图; S6、 通过部分解码器模块生成精确的位置图; S7、 训 练构建好的基于模仿人类视觉系统对伪装目标 检测与分割模型。 方法主要由编码器模块, 桥接 模块, 邻域连接解码器模块和部分解码器模块组 成, 通过对神经网络进行训练, 得到最优参数, 实 现对伪装目标的自动检测与分割。 权利要求书2页 说明书6页 附图2页 CN 114627299 A 2022.06.14 CN 114627299 A 1.一种模仿人类视 觉系统对伪装目标检测与分割方法, 其特 征在于, 包括如下步骤: S1、 制作预训练数据集; S2、 构建基于模仿人类视觉系统对伪装目标检测与分割的模型, 所述模型包括编码器 模块、 桥接模块、 邻域连接解码器模块和部分解码器模块; S3、 通过编码器模块 提取显著性信息; S4、 通过桥接模块扩大全局感受野; S5、 通过邻域连接解码器模块 生成粗糙位置图; S6、 通过部分解码器模块 生成精确的位置图; S7、 训练构建好的基于模仿人类视 觉系统对伪装目标检测与分割模型。 2.根据权利要求1所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述编码器模块包括34个基本块, 每个所述基础块包括一个残差支路和短接支路, 所述桥 接模块包括3层基础层, 每一层所述基础层由3 ×3的膨胀卷积层、 BN层和ReLU函数组成, 所 述邻域连接解码器为聚合特征金字塔结构, 所述邻域连接解码器模块包括上采样、 3 ×3的 卷积层、 BN层和拼接, 所述部分解码器模块包括卷积层、 BN层和ReLU激活函数, 所述部分解 码器模块的结构与邻域连接解码器结构类似, 为聚合特 征金字塔结构。 3.根据权利要求2所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S3的具体方法: 使用预训练数据提取5层特征 ƒi(i=1,2,3,4,5), ƒ1和ƒ2为低级 语义特征, 包括图像的颜色、 亮度, ƒ3、ƒ4和ƒ5层为高级语义特征, 包括图像的纹理、 位置、 上下文内容。 4.根据权利要求3所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S4的具体方法: 仅对步骤S3提 取的ƒ3,ƒ4,ƒ5层特征进行桥接处理, 通过模 仿人眼 的全局观测能力, 着重观察全局信息, 得到 , 以进一步扩大模型对该3层全局感 受野。 5.根据权利要求4所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S5的具体方法: 模仿人眼对 3个信息进行初步处理, 其具体操作是将高 级特征与低级 特征逐层进 行逐元素相乘并拼接, 用于保持层内的语义一致性并跨层拼接上 下文信息, 定位隐藏对象, 生成粗 糙的位置图。 6.根据权利要求5所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S6的具体方法: 将输出的粗糙位置图通过部 分解码器模块逐元素相乘并与上层特 征进行拼接处 理。 7.根据权利要求1 ‑6任意一项所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S7的具体方法: 训练过程中, 分别对由编码 器模块、 桥接模块、 邻域连 接解码器模块和部 分解码器模块得到的结果进行监督, 将结果通过双线性插值上采样进 行 放大, 使其与输入数据具有相同的尺寸, 后经过sigmoid函数将结果映射至0 ‑1, 得到预测 图, 通过对比预测图与GT图的差异, 观测4个损失值的和是否收敛来判断网络的训练过程。 8.根据权利要求7所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S3中, 使用由34个基本块组成编码器, 导入预训练数据, 提取5层特征 ƒi(i=1,2,权 利 要 求 书 1/2 页 2 CN 114627299 A 23,4,5),各层特征之间以最大池化的下采样连接, 输出信息尺寸分别为原图像的1/1, 1/2, 1/4, 1/8和1/16, 通道数分别为64,128,25 6,512,512。 9.根据权利要求7所述的模仿人类视觉系统对伪装目标检测与分割方法, 其特征在于, 所述步骤S7中输入数据的尺寸统一调整为224 ×224×3, 批处理大小设置为8, 在训练过程 中利用Adam优化器对 模型参数进行 更新操作, 初始学习率设置为1e ‑3。权 利 要 求 书 2/2 页 3 CN 114627299 A 3

.PDF文档 专利 一种模仿人类视觉系统对伪装目标检测与分割方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模仿人类视觉系统对伪装目标检测与分割方法 第 1 页 专利 一种模仿人类视觉系统对伪装目标检测与分割方法 第 2 页 专利 一种模仿人类视觉系统对伪装目标检测与分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:34:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。