(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210330773.0
(22)申请日 2022.03.30
(71)申请人 南京信息职业 技术学院
地址 210000 江苏省南京市仙林大 学城文
澜路99号
(72)发明人 杨永鹏 郑艺欣 杨真真 邵静
林畅 张宇卓
(74)专利代理 机构 南京经纬专利商标代理有限
公司 32200
专利代理师 田凌涛
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于改进YOLOv4的图像目标检测方法
(57)摘要
本发明涉及一种基于改进YOLOv4的图像目
标检测方法, 基于现有YOLOv4 路径增强 网络进行
改进, 通过增加检测层的设计, 加强浅层特征融
合的效果, 并结合聚类方法下, 所获图像集对应
的各先验框尺 寸, 实现各检测层的高精度特征提
取, 并且引入多尺度池化模块并行结构、 结合卷
积处理与插值处理的金字塔池化模块, 进一步特
征层的检测精度, 进而有效提高对图片目标物检
测的准确率; 在实际的仿真实验当中, 本发明设
计方法表现出了优秀的目标检测准确率, 在
PASCAL VOC2007和VOC2012两个数据集上 的mAP
分别提高了2.0 3%和1.94%。
权利要求书2页 说明书7页 附图2页
CN 114818872 A
2022.07.29
CN 114818872 A
1.一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 基于各幅分别已知其图像
中目标类型对象位置的样本图像, 按如下步骤A至步骤C, 获得目标识别模型; 然后针对与样
本图像同类型场景的待识别图像, 应用目标识别模型获得待识别图像中的目标类型对象位
置, 完成图像目标检测;
步骤A. 采用预设聚类算法, 针对各幅样本图像所构成的图像集进行处理, 获得该图像
集所对应预设数量M个先验框尺寸, 然后进入步骤B;
步骤B. 基于以YOLOv4网络为基础、 包括预设数量N个检测 层的目标YOLOv4网络, M/N的
结果为大于0的整数, 按各检测层分别对应M/N个先验框, 针对尺寸由小至大排序的各个先
验框, 顺序分别对应尺度由大至小排序的各检测层, 基于目标YOLOv4网络的输入端接收图
像, 各检测层分别基于其所对应的各 先验框、 输出 该图像所对应的特 征图, 然后进入步骤C;
步骤C. 基于目标YOLOv4网络、 结合其各检测层输出端均对接同一个图像整合模块所
构成的待训练识别模 型, 以及各样 本图像, 以样本图像作为输入, 标识目标类型对象位置的
样本图像为输出, 针对待训练识别模型进行训练, 获得目标识别模型。
2.根据权利 要求1所述一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 所述步
骤A中, 采用K ‑means聚类算法, 针对 各幅样本图像所构成的图像集进 行处理, 获得该图像集
所对应预设数量M个先验框尺寸。
3.根据权利 要求1所述一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 所述目
标YOLOv4网络以YOLOv4网络为基础、 包括4个检测层, 各检测层分别均包括 darknet卷积模
块DBL与卷积模块conv, 各检测层中, darknet卷积模块DBL的输入端构成检测层的输入端,
darknet卷积模块DBL的输出端对接对应卷积模块conv的输入端, 卷积模块conv的输出端构
成检测层的输出端; 各检测层按其尺度由大至小排序, 构成检测层排序;
目标YOLOv4网络中还包括前置加 强特征提取网络、 第一子加 强特征提取网络、 第二子
加强特征提取网络、 第三子加强特征提取网络、 以及第一前置检测模块、 第二前置检测模
块、 第三前置检测模块; 前置加强特征提取网络包括依次串 联的darknet卷积模块DBL、 上采
样并联模块SPP、 darknet卷积模块DBL, 其中, 第一个darknet卷积模块DBL的输入端构成前
置加强特征提取网络的输入端, 第二个dar knet卷积模块DBL的输出端构成前置加强特征提
取网络的输出端; 各子加强特征提取网络分别均包括上采样模块upsample、 连接模块
concat、 以及三个darknet卷积模块DBL, 各子加强特征提取网络中, 第一个darknet卷积模
块DBL的输入端构成子加强特征提取网络的第一输入端, 第二个 darknet卷积模块DBL的输
入端构成子加强特征提取网络的第二输入端, 第一个dar knet卷积模块DBL的输出端对接上
采样模块upsample的输入端, 上采样模块upsample的输出端、 第二个darknet卷积模块DBL
的输出端对接连接模块concat的输入端, 连接模块concat的输出端对接第三个darknet卷
积模块DBL的输入端, 第三个 darknet卷积模块DBL的输出端构成子加强特征提取网络的输
出端; 第一前置检测模块、 第二前置检测模块、 第三前置检测模块分别均包括连接模块
concat、 以及两个darknet卷积 模块DBL, 各前置检测模块中, 第一个darknet卷积模块DBL的
输入端构成前置检测模块的第一输入端, 第一个dar knet卷积模块DBL的输出端对接连接模
块concat的其中一个输入端, 连接模块concat的另一个输入端构成前置检测模块的第二输
入端, 连接模块co ncat的输出端构成前置检测模块的输出端;
目标YOLOv4网络的结构中, YOLOv4网络中主干特征提取网络的输入端构成目标YOLOv4权 利 要 求 书 1/2 页
2
CN 114818872 A
2网络的输入端, 主干特征提取网络的输出端对接前置加强特征提取网络的输入端, 前置加
强特征提取网络的输出端对接第一子加强特征提取网络的第一输入端, 主干特征提取网络
的输出端对接第一子加强特征提取网络的第二输入端; 第一子加强特征提取网络的输出端
对接第二子加强特征提取网络的第一输入端, 主干特征提取网络上顺序第二分支输出端对
接第二子加强特征提取网络的第二输入端; 第二子加强特征提取网络的输出端对接第三子
加强特征提取网络的第一输入端, 主干特征提取网络上顺序第一分支输出端对接第三子加
强特征提取网络的第二输入端; 第三子加强特征提取网络的输出端对接检测层排序中第一
个检测层的输入端; 第三子加强特征提取网络中连接模块concat的输出端对接第一前置检
测模块的第一输入端, 第二子加强特征提取网络的输出端对接第一前置检测模块的第二输
入端, 第一前置检测模块的输出端对接检测层排序中第二个检测层的输入端; 第一前置检
测模块中连接模块concat的输出端对接第二前置检测模块的第一输入端, 第一子加强特征
提取网络的输出端对接第二前置检测模块的第二输入端, 第二前置检测模块的输出端对接
检测层排序中第三个检测层的输入端; 第二前置检测模块中连接模块concat的输出端对接
第三前置检测模块的第一输入端, 前置加强特征提取网络的输出端对接第三前置检测模块
的第二输入端, 第三前置检测模块的输出端对接检测层排序中第四个 检测层的输入端。
4.根据权利 要求3所述一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 所述目
标YOLOv4网络中还包括金字塔池化模块, 金字塔池化模块包括卷积模块、 双 线性插值模块、
以及预设数量个不同池化核大小的池化模块, 其中, 各池化模块的输入端构成金字塔池化
模块的各输入端, 各池化模块的输出端对接卷积模块的输入端, 卷积模块的输出端对接双
线性插值模块的输入端, 双线性插值模块的输出端构成金字塔池化模块的输出端, 金字塔
池化模块的各输入端同时与金字塔池化模块的输出端相连; 所述主干特征提取网络的输出
端对接金字塔池化模块的各输入端, 金字塔池化模块的输出端对接所述前置加强特征提取
网络的输入端。
5.根据权利 要求4所述一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 所述金
字塔池化模块中池化模块的数量为4个, 分别为6 ×6池化核大小的池化模块、 3 ×3池化核大
小的池化模块、 2 ×2池化核大小的池化模块、 1 ×1池化核大小的池化模块, 金字塔池化模块
中卷积模块的卷积核大小为1 ×1。
6.根据权利 要求3所述一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 所述各
darknet卷积模块DBL分别均包括顺序相连的卷积模块conv、 归一化模块BN、 激活模块, 其
中, 卷积模块conv的输入端构成darknet卷积模块DBL的输入端, 激活模块的输出端构成
darknet卷积模块DBL的输出端。
7.根据权利 要求3所述一种基于改进YOLOv4的图像目标检测方法, 其特征在于: 所述上
采样并联模块SPP包括连接模块concat、 以及三个最大池化模块maxpool, 上采样并联模块
SPP中, 各最大池化模块maxpool的输入端相连、 并构成上采样并联模块SPP的输入端, 各最
大池化模块maxpool的输出端、 以及上采样并联模块SPP的输入端与连接模块concat的输入
端相连, 连接模块co ncat的输出端构成上采样并联模块S PP的输出端。
8.根据权利 要求3所述一种基于改进YOLOv4的图像目标检测方法, 其特征
专利 一种基于改进YOLOv4的图像目标检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:31:57上传分享