安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210139572.2 (22)申请日 2022.02.15 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 武秉泓 杨叶辉 王兆玮 杨大陆  王晓荣 王磊 黄海峰  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 王江选 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 图像处理方法、 深度学习模型的训练方法、 装置和设备 (57)摘要 本公开提供了一种图像处理方法, 涉及人工 智能领域, 尤其涉及深度学习领域。 具体实现方 案为: 根据待处理图像的第一特征图, 确定移位 偏移值; 根据移位偏移值, 对第一特征图中的数 据块进行移位, 得到移位后的第一特征图; 以及 根据移位后的第一特征图, 得到待处理图像的第 二特征图。 本公开还提供了一种深度学习模型的 训练方法、 装置、 电子设备和存 储介质。 权利要求书3页 说明书11页 附图9页 CN 114463561 A 2022.05.10 CN 114463561 A 1.一种图像处 理方法, 包括: 根据待处 理图像的第一特 征图, 确定移位偏移值; 根据所述移位偏移值, 对所述第一特征图中的数据块进行移位, 得到移位后的第一特 征图; 以及 根据所述移位后的第一特 征图, 得到所述待处 理图像的第二特 征图。 2.根据权利要求1所述的方法, 其中, 所述 根据所述第一特 征图, 确定移位偏移值包括: 确定所述第一特 征图的第一特 征子图和第二特 征子图; 分别确定所述第一特 征子图的第一均值和第二特 征子图的第二均值; 以及 根据所述第一均值和第二均值, 确定所述移位偏移值。 3.根据权利要求2所述的方法, 其中, 所述分别确定所述第 一特征子图的第 一均值和第 二特征子图的第二均值包括: 通过对所述第 一特征子图和第 二特征子图分别进行全局 平均池化, 确定所述第 一均值 和所述第二均值。 4.根据权利要求2或3所述的方法, 其中, 所述根据 所述第一均值和第 二均值, 确定所述 移位偏移值包括; 对所述第一均值和第二均值分别进行归一化, 得到第一比例和第二比例, 作为所述移 位偏移值。 5.根据权利要求4所述的方法, 其中, 所述根据所述移位偏移值, 对所述第一特征图中 的数据块进行移位, 得到移位后的第一特 征图包括: 分别将所述第 一比例和第 二比例应用于所述第 一特征图, 得到第 一特征图中的第 一数 据块和第二数据块; 以及 将所述第一数据块和第二数据块进行移位, 得到所述移位后的第一特 征图。 6.根据权利要求1 ‑5之一所述的方法, 其中, 所述根据所述移位后的第一特征图, 得到 所述待处 理图像的第二特 征图包括: 将所述移位后的第一特 征图划分为多个特 征图块; 以及 对所述多个特 征图块进行处 理, 得到所述待处 理图像的第二特 征图。 7.根据权利要求6所述的方法, 其中, 所述对所述多个特征图块进行处理, 得到所述待 处理图像的第二特 征图包括: 针对所述多个特征图块中的每个特征图块, 进行多头自注意力特征检测, 得到所述待 处理图像的第二特 征图。 8.根据权利要求1所述的方法, 还 包括: 根据所述待处 理图像的第二特 征图, 检测所述待处 理图像中的目标对象。 9.一种深度学习模型的训练方法, 所述深度学习模型包括第一子网络和第二子网络, 所述方法包括: 将样本图像输入第一子网络, 得到第一特 征图; 将所述第一特 征图输入第二子网络, 得到所述待处 理图像的第二特 征图; 根据所述第二特 征图, 得到所述样本图像的检测值; 以及 根据所述样本图像的检测值与所述样本图像的标签之间的差异, 调 整所述第 一子网络 的参数和所述第二子网络的参数, 得到经训练的深度学习模型;权 利 要 求 书 1/3 页 2 CN 114463561 A 2其中, 所述第二特 征图是通过以下操作得到的: 对所述第一特 征图中的数据块进行移位, 得到移位后的第一特 征图; 以及 根据所述移位后的第一特 征图, 得到所述待处 理图像的第二特 征图。 10.根据权利要求9所述的方法, 其中, 所述深度学习 模型包括多个特征提取级, 每个特 征提取级包括所述第一子网络和所述第二子网络; 所述第二子网络包括多头自注意力检测分支和移位偏移值确定分支。 11.根据权利要求10所述的方法, 其中, 所述移位偏移值确定分支包括: 卷积层, 用于确定所述第一特 征图的第一特 征子图和第二特 征子图; 全局平均池化层, 用于分别确定所述第 一特征子图的第 一均值和第 二特征子图的第 二 均值; 以及 映射层, 用于将所述第一均值和第二均值分别映射到预定范围数值内。 12.一种图像处 理装置, 包括: 确定模块, 用于根据待处 理图像的第一特 征图, 确定移位偏移值; 移位模块, 用于根据 所述移位偏移值, 对所述第 一特征图中的数据块进行移位, 得到移 位后的第一特 征图; 以及 第一获得模块, 用于根据所述移位后的第一特征图, 得到所述待处理图像的第二特征 图。 13.根据权利要求12所述的装置, 其中, 所述确定模块包括: 第一确定 子模块, 用于确定所述第一特 征图的第一特 征子图和第二特 征子图; 第二确定子模块, 用于分别确定所述第 一特征子图的第 一均值和第 二特征子图的第 二 均值; 以及 第三确定 子模块, 用于根据所述第一均值和第二均值, 确定所述移位偏移值。 14.根据权利要求12所述的装置, 其中, 所述第二确定 子模块包括: 全局平均池化单元, 用于通过对所述第 一特征子图和第 二特征子图分别进行全局 平均 池化, 确定所述第一均值和所述第二均值。 15.根据权利要求12或13所述的装置, 其中, 所述第三确定 子模块包括; 归一化单元, 用于对所述第一均值和第二均值分别进行归一化, 得到第一比例和第二 比例, 作为所述移位偏移值。 16.根据权利要求14所述的装置, 其中, 所述移位模块包括: 第一获得子模块, 用于分别将所述第一比例和第二比例应用于所述第一特征图, 得到 第一特征图中的第一数据块和第二数据块; 以及 第一移位子模块, 用于将所述第一数据块和第二数据块进行移位, 得到所述移位后的 第一特征图。 17.根据权利要求12 ‑16之一所述的装置, 其中, 所述第一获得模块包括: 划分子模块, 用于将所述移位后的第一特 征图划分为多个特 征图块; 以及 处理子模块, 用于对所述多个特 征图块进行处 理, 得到所述待处 理图像的第二特 征图。 18.根据权利要求17 所述的装置, 其中, 所述处 理子模块包括: 多头自注意力特征检测单元, 用于针对所述多个特征图块中的每个特征图块, 进行多 头自注意力特 征检测, 得到所述待处 理图像的第二特 征图。权 利 要 求 书 2/3 页 3 CN 114463561 A 3

PDF文档 专利 图像处理方法、深度学习模型的训练方法、装置和设备

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理方法、深度学习模型的训练方法、装置和设备 第 1 页 专利 图像处理方法、深度学习模型的训练方法、装置和设备 第 2 页 专利 图像处理方法、深度学习模型的训练方法、装置和设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:07:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。