(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210469223.7
(22)申请日 2022.04.28
(71)申请人 浙江科技学院
地址 310023 浙江省杭州市留和路318号
(72)发明人 黄炳强 项新建 潘磊 厉阳
(74)专利代理 机构 哈尔滨市文 洋专利代理事务
所(普通合伙) 23210
专利代理师 解莹明
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 10/80(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种人体目标识别方法及系统
(57)摘要
本发明提供一种人体目标识别方法系及系
统, 采用改进 的轻量型Yolov5s网络目标检测模
型, 方法包括以下步骤: 实时采集人体目标运动
视频, 人体目标运动视频中每一帧原始人体目标
运动图片输入模型; 进行预处理; 进行多尺度融
合; 构建Ciou损失函数CiouLoss和宽高比例γ函
数, 评估所述多尺度融合后的预测框内图像与真
实框内图像的人体目标识别定位效果, 若
CiouLoss<0.2且γ<0.03则完成人体目标识别,
并输出得到识别的人体目标图像, 否则重复上述
步骤。 本发 明能够有效降低人体目标识别检测的
计算量的同时, 又能够具有较高的精 准率和召回
率; 本发明方法改进的Yolov5s模型在 精度、 召回
率、 检测速度、 GPU性能上均有提升 。
权利要求书3页 说明书12页 附图5页
CN 114913454 A
2022.08.16
CN 114913454 A
1.一种人体目标识别方法, 采用改进的轻量型Yolov5s网络目标检测模型, 其特征在
于, 所述方法包括以下步骤:
1)实时采集人体目标运动视频, 所述人体目标运动视频中每一帧原始人体目标运动图
片输入模型;
2)对所述原 始人体目标运动图片进行 预处理;
3)对所述 步骤2)得到的预处 理后的人体目标运动图片进行多尺度融合;
4)构建Ci ou损失函数Ci ouLoss和宽高比例γ函数;
5)评估所述步骤3)多尺度融合后的预测框内图像与真实框内图像的人体目标识别定
位的建Ciou损失函 数CiouLoss值和宽高比例γ 函数值, 若CiouLoss<0.2且γ<0.03则完成人
体目标识别, 并输出 得到识别的人体目标图像, 否则重复所述 步骤1)‑3)。
2.根据权利要求1所述的人体目标识别方法, 其特征在于, 所述步骤2)中对所述原始人
体目标运动图片进行 预处理包括:
2.1)对所述步骤1)采集到的大小为X ×X×3的原始人体目标运动图片降维, 得到大小
为
的特征图, 将所述原 始图片上的信息保存在通道数 上;
2.2)对所述2.1)步骤得到的图片进行二分组卷积, 拼接得到主干最终特 征图;
2.3)对所述步骤2.2)拼接得到的最终特征图进行深度可分离卷积和分组数为 g组的分
组卷积, 通过加乘的分解 步骤减少整体网络的参 量数;
2.4)重复所述 步骤2.2) ‑2.3)两次, 完成对所述原 始人体目标运动图片的预处 理。
3.根据权利要求2所述的人体目标识别方法, 其特征在于, 所述步骤2.1)中的X的大小
为80‑640。
4.根据权利要求1所述的人体目标识别方法, 其特征在于, 所述步骤3)中对所述步骤2)
得到的预处 理后的人体目标运动图片进行多尺度融合包括以下步骤:
3.1)对预处理后的人体目标运动图片进行二分组卷积, 拼接得到Neck特征处理最终特
征图;
3.2)使用不同尺寸的池化窗口分别对数据进行池化, 然后再对不同池化窗口的池化结
果进行拼接, 进行多尺度融合;
3.3)对所述步骤3.2)多尺度融合后的图像进行深度可分离卷积和分组数为g组的分组
卷积, 通过加乘的分解 步骤减少整体网络的参 量数;
3.4)对所述3.3)步骤处理后得到的图片同时使用均值池化和最大值池化, 构建CBAM
卷积注意池化模 型, 将所述步骤3.3)处理后大小为H ×W×C的输入特征图池化为大小为H ×
W×1的输出特征图;
3.5)对所述 步骤3.4)得到的池化 为H×W×1的输出特征图进行普通卷积后输出。
5.根据权利 要求4所述的人体目标识别方法, 其特征在于, 所述3.4)步骤中构 建的CBAM
卷积注意池化模型公式如下:
Ms(F)=σ(f7×7([AvgPool(F); MaxPo ol(F)]));
其中, σ 表示sigmoid激活函数, f7×7表示7×7卷积核的卷积操作, AvgPool(F)表示均值
池化, MaxPo ol(F)表示 最大值池化, F为所述 步骤3.3)处 理后大小为H ×W×C的输入特 征图。
6.根据权利要求4所述的人体目标识别方法, 其特征在于, 所述步骤3.2)中的池化窗口权 利 要 求 书 1/3 页
2
CN 114913454 A
2的尺寸为5×5、 9×9和13×13。
7.根据权利要求2或4所述的人体目标识别方法, 其特征在于, 所述深度 可分离卷积, 包
括: 将输入大小为DF×DF×N的特征图, 转换为N个标准卷积核DK×DK×M, 然后再将每个所述
标准卷积核拆分为M个DK×DK×1的深度卷积和1 ×1×M逐点卷积, 其卷积计算 量公式如下:
(DK·DK·M·DF·DF+M·DF·DF)·N;
其中, DK·DK·M·DF·DF表示深度卷积计算量, M ·N·DF·DF表示逐点卷积计算量, DK表
示卷积核大小, M是输入特 征图的通道数, N 为输出特征层通道数。
8.根据权利要求2或4所述的人体目标识别方法, 其特征在于, 所述分组数为g组的分组
卷积为将维度为H ×W×C1的输入特征图, 按照通道数分为g组, 进而得到维度为
的
分组后输入特 征图;
所述维度为H ×W×C1的输入特 征图的卷积核大小为
所述分组后输入特 征图的
维度为
拼接出的最终特征图的维度为H ×W×C2, 即所述步骤2.2)和步骤 3.1)拼接
得到的主干最终特征图的维度和Neck特征 处理最终特征图的维度均为H ×W×C2; 其中, H为
输入特征图的高度, W为输入特征图的宽度, C1为输入特征图的通道数, C2为最终特征图的
通道数, K为分组卷积的卷积核长度值和宽度值;
分组卷积的计算公式为
9.根据权利 要求1所述的人体目标识别方法, 其特征在于, 所述步骤4)中的Ciou损失函
数CiouLoss如下:
其中, Distance_O2表示预测框与真实框两个中心点的欧式距离, Distance_C2表示预测
框与真实框的最小外接矩形的对角线距离; γ为宽高比例, Iou为预测框与真实框的交联
比,
所述宽高比例γ函数如下:
其中, wgt表示真实框的宽度, hgt表示真实框的高度, wp表示预测框 的宽度, hp表示预测
框的高度。
10.人体目标识别系统, 其特征在于, 包括人体目标运动图片采集模块、 人体目标图片
预处理模块、 人体目标图片多角度融合模块、 人体目标识别控制模块;
所述人体目标运动图片采集模块, 用于实时采集人体目标运动视频, 并将采集到的人
体目标运动视频中每一帧原 始人体目标运动图片输入 模型;
所述人体目标运动图片预处 理模块, 用于对所述原 始人体目标运动图片进行 预处理;
所述人体目标图片多角度融合模块, 用于对预处理后的人体目标运动图片进行多尺度
融合;
所述人体目标识别控制模块, 用于构建Ciou损失函数CiouLoss和宽高比例γ函数, 评估权 利 要 求 书 2/3 页
3
CN 114913454 A
3
专利 一种人体目标识别方法及系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:31:42上传分享