安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210469223.7 (22)申请日 2022.04.28 (71)申请人 浙江科技学院 地址 310023 浙江省杭州市留和路318号 (72)发明人 黄炳强 项新建 潘磊 厉阳  (74)专利代理 机构 哈尔滨市文 洋专利代理事务 所(普通合伙) 23210 专利代理师 解莹明 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种人体目标识别方法及系统 (57)摘要 本发明提供一种人体目标识别方法系及系 统, 采用改进 的轻量型Yolov5s网络目标检测模 型, 方法包括以下步骤: 实时采集人体目标运动 视频, 人体目标运动视频中每一帧原始人体目标 运动图片输入模型; 进行预处理; 进行多尺度融 合; 构建Ciou损失函数CiouLoss和宽高比例γ函 数, 评估所述多尺度融合后的预测框内图像与真 实框内图像的人体目标识别定位效果, 若 CiouLoss<0.2且γ<0.03则完成人体目标识别, 并输出得到识别的人体目标图像, 否则重复上述 步骤。 本发 明能够有效降低人体目标识别检测的 计算量的同时, 又能够具有较高的精 准率和召回 率; 本发明方法改进的Yolov5s模型在 精度、 召回 率、 检测速度、 GPU性能上均有提升 。 权利要求书3页 说明书12页 附图5页 CN 114913454 A 2022.08.16 CN 114913454 A 1.一种人体目标识别方法, 采用改进的轻量型Yolov5s网络目标检测模型, 其特征在 于, 所述方法包括以下步骤: 1)实时采集人体目标运动视频, 所述人体目标运动视频中每一帧原始人体目标运动图 片输入模型; 2)对所述原 始人体目标运动图片进行 预处理; 3)对所述 步骤2)得到的预处 理后的人体目标运动图片进行多尺度融合; 4)构建Ci ou损失函数Ci ouLoss和宽高比例γ函数; 5)评估所述步骤3)多尺度融合后的预测框内图像与真实框内图像的人体目标识别定 位的建Ciou损失函 数CiouLoss值和宽高比例γ 函数值, 若CiouLoss<0.2且γ<0.03则完成人 体目标识别, 并输出 得到识别的人体目标图像, 否则重复所述 步骤1)‑3)。 2.根据权利要求1所述的人体目标识别方法, 其特征在于, 所述步骤2)中对所述原始人 体目标运动图片进行 预处理包括: 2.1)对所述步骤1)采集到的大小为X ×X×3的原始人体目标运动图片降维, 得到大小 为 的特征图, 将所述原 始图片上的信息保存在通道数 上; 2.2)对所述2.1)步骤得到的图片进行二分组卷积, 拼接得到主干最终特 征图; 2.3)对所述步骤2.2)拼接得到的最终特征图进行深度可分离卷积和分组数为 g组的分 组卷积, 通过加乘的分解 步骤减少整体网络的参 量数; 2.4)重复所述 步骤2.2) ‑2.3)两次, 完成对所述原 始人体目标运动图片的预处 理。 3.根据权利要求2所述的人体目标识别方法, 其特征在于, 所述步骤2.1)中的X的大小 为80‑640。 4.根据权利要求1所述的人体目标识别方法, 其特征在于, 所述步骤3)中对所述步骤2) 得到的预处 理后的人体目标运动图片进行多尺度融合包括以下步骤: 3.1)对预处理后的人体目标运动图片进行二分组卷积, 拼接得到Neck特征处理最终特 征图; 3.2)使用不同尺寸的池化窗口分别对数据进行池化, 然后再对不同池化窗口的池化结 果进行拼接, 进行多尺度融合; 3.3)对所述步骤3.2)多尺度融合后的图像进行深度可分离卷积和分组数为g组的分组 卷积, 通过加乘的分解 步骤减少整体网络的参 量数; 3.4)对所述3.3)步骤处理后得到的图片同时使用均值池化和最大值池化, 构建CBAM   卷积注意池化模 型, 将所述步骤3.3)处理后大小为H ×W×C的输入特征图池化为大小为H × W×1的输出特征图; 3.5)对所述 步骤3.4)得到的池化 为H×W×1的输出特征图进行普通卷积后输出。 5.根据权利 要求4所述的人体目标识别方法, 其特征在于, 所述3.4)步骤中构 建的CBAM 卷积注意池化模型公式如下: Ms(F)=σ(f7×7([AvgPool(F); MaxPo ol(F)])); 其中, σ 表示sigmoid激活函数, f7×7表示7×7卷积核的卷积操作, AvgPool(F)表示均值 池化, MaxPo ol(F)表示 最大值池化, F为所述 步骤3.3)处 理后大小为H ×W×C的输入特 征图。 6.根据权利要求4所述的人体目标识别方法, 其特征在于, 所述步骤3.2)中的池化窗口权 利 要 求 书 1/3 页 2 CN 114913454 A 2的尺寸为5×5、 9×9和13×13。 7.根据权利要求2或4所述的人体目标识别方法, 其特征在于, 所述深度 可分离卷积, 包 括: 将输入大小为DF×DF×N的特征图, 转换为N个标准卷积核DK×DK×M, 然后再将每个所述 标准卷积核拆分为M个DK×DK×1的深度卷积和1 ×1×M逐点卷积, 其卷积计算 量公式如下: (DK·DK·M·DF·DF+M·DF·DF)·N; 其中, DK·DK·M·DF·DF表示深度卷积计算量, M ·N·DF·DF表示逐点卷积计算量, DK表 示卷积核大小, M是输入特 征图的通道数, N 为输出特征层通道数。 8.根据权利要求2或4所述的人体目标识别方法, 其特征在于, 所述分组数为g组的分组 卷积为将维度为H ×W×C1的输入特征图, 按照通道数分为g组, 进而得到维度为 的 分组后输入特 征图; 所述维度为H ×W×C1的输入特 征图的卷积核大小为 所述分组后输入特 征图的 维度为 拼接出的最终特征图的维度为H ×W×C2, 即所述步骤2.2)和步骤 3.1)拼接 得到的主干最终特征图的维度和Neck特征 处理最终特征图的维度均为H ×W×C2; 其中, H为 输入特征图的高度, W为输入特征图的宽度, C1为输入特征图的通道数, C2为最终特征图的 通道数, K为分组卷积的卷积核长度值和宽度值; 分组卷积的计算公式为 9.根据权利 要求1所述的人体目标识别方法, 其特征在于, 所述步骤4)中的Ciou损失函 数CiouLoss如下: 其中, Distance_O2表示预测框与真实框两个中心点的欧式距离, Distance_C2表示预测 框与真实框的最小外接矩形的对角线距离; γ为宽高比例, Iou为预测框与真实框的交联 比, 所述宽高比例γ函数如下: 其中, wgt表示真实框的宽度, hgt表示真实框的高度, wp表示预测框 的宽度, hp表示预测 框的高度。 10.人体目标识别系统, 其特征在于, 包括人体目标运动图片采集模块、 人体目标图片 预处理模块、 人体目标图片多角度融合模块、 人体目标识别控制模块; 所述人体目标运动图片采集模块, 用于实时采集人体目标运动视频, 并将采集到的人 体目标运动视频中每一帧原 始人体目标运动图片输入 模型; 所述人体目标运动图片预处 理模块, 用于对所述原 始人体目标运动图片进行 预处理; 所述人体目标图片多角度融合模块, 用于对预处理后的人体目标运动图片进行多尺度 融合; 所述人体目标识别控制模块, 用于构建Ciou损失函数CiouLoss和宽高比例γ函数, 评估权 利 要 求 书 2/3 页 3 CN 114913454 A 3

.PDF文档 专利 一种人体目标识别方法及系统

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种人体目标识别方法及系统 第 1 页 专利 一种人体目标识别方法及系统 第 2 页 专利 一种人体目标识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:31:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。