专利 一种人体目标识别方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210469223.7 (22)申请日 2022.04.28 (71)申请人浙江科技学院地址 310023 浙江省杭州市留和路318号 (72)发明人黄炳强　项新建　潘磊　厉阳　 (74)专利代理机构哈尔滨市文洋专利代理事务所(普通合伙) 23210 专利代理师解莹明 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种人体目标识别方法及系统 (57)摘要本发明提供一种人体目标识别方法系及系统，采用改进的轻量型Yolov5s网络目标检测模型，方法包括以下步骤：实时采集人体目标运动视频，人体目标运动视频中每一帧原始人体目标运动图片输入模型；进行预处理；进行多尺度融合；构建Ciou损失函数CiouLoss和宽高比例γ函数，评估所述多尺度融合后的预测框内图像与真实框内图像的人体目标识别定位效果，若 CiouLoss＜0.2且γ＜0.03则完成人体目标识别，并输出得到识别的人体目标图像，否则重复上述步骤。本发明能够有效降低人体目标识别检测的计算量的同时，又能够具有较高的精准率和召回率；本发明方法改进的Yolov5s模型在精度、召回率、检测速度、 GPU性能上均有提升。权利要求书3页说明书12页附图5页 CN 114913454 A 2022.08.16 CN 114913454 A 1.一种人体目标识别方法，采用改进的轻量型Yolov5s网络目标检测模型，其特征在于，所述方法包括以下步骤： 1)实时采集人体目标运动视频，所述人体目标运动视频中每一帧原始人体目标运动图片输入模型； 2)对所述原始人体目标运动图片进行预处理； 3)对所述步骤2)得到的预处理后的人体目标运动图片进行多尺度融合； 4)构建Ci ou损失函数Ci ouLoss和宽高比例γ函数； 5)评估所述步骤3)多尺度融合后的预测框内图像与真实框内图像的人体目标识别定位的建Ciou损失函数CiouLoss值和宽高比例γ 函数值，若CiouLoss＜0.2且γ＜0.03则完成人体目标识别，并输出得到识别的人体目标图像，否则重复所述步骤1)‑3)。 2.根据权利要求1所述的人体目标识别方法，其特征在于，所述步骤2)中对所述原始人体目标运动图片进行预处理包括： 2.1)对所述步骤1)采集到的大小为X ×X×3的原始人体目标运动图片降维，得到大小为的特征图，将所述原始图片上的信息保存在通道数上； 2.2)对所述2.1)步骤得到的图片进行二分组卷积，拼接得到主干最终特征图； 2.3)对所述步骤2.2)拼接得到的最终特征图进行深度可分离卷积和分组数为 g组的分组卷积，通过加乘的分解步骤减少整体网络的参量数； 2.4)重复所述步骤2.2) ‑2.3)两次，完成对所述原始人体目标运动图片的预处理。 3.根据权利要求2所述的人体目标识别方法，其特征在于，所述步骤2.1)中的X的大小为80‑640。 4.根据权利要求1所述的人体目标识别方法，其特征在于，所述步骤3)中对所述步骤2) 得到的预处理后的人体目标运动图片进行多尺度融合包括以下步骤： 3.1)对预处理后的人体目标运动图片进行二分组卷积，拼接得到Neck特征处理最终特征图； 3.2)使用不同尺寸的池化窗口分别对数据进行池化，然后再对不同池化窗口的池化结果进行拼接，进行多尺度融合； 3.3)对所述步骤3.2)多尺度融合后的图像进行深度可分离卷积和分组数为g组的分组卷积，通过加乘的分解步骤减少整体网络的参量数； 3.4)对所述3.3)步骤处理后得到的图片同时使用均值池化和最大值池化，构建CBAM 卷积注意池化模型，将所述步骤3.3)处理后大小为H ×W×C的输入特征图池化为大小为H × W×1的输出特征图； 3.5)对所述步骤3.4)得到的池化为H×W×1的输出特征图进行普通卷积后输出。 5.根据权利要求4所述的人体目标识别方法，其特征在于，所述3.4)步骤中构建的CBAM 卷积注意池化模型公式如下： Ms(F)＝σ(f7×7([AvgPool(F)； MaxPo ol(F)]))；其中， σ 表示sigmoid激活函数， f7×7表示7×7卷积核的卷积操作， AvgPool(F)表示均值池化， MaxPo ol(F)表示最大值池化， F为所述步骤3.3)处理后大小为H ×W×C的输入特征图。 6.根据权利要求4所述的人体目标识别方法，其特征在于，所述步骤3.2)中的池化窗口权　利　要　求　书 1/3 页 2 CN 114913454 A 2的尺寸为5×5、 9×9和13×13。 7.根据权利要求2或4所述的人体目标识别方法，其特征在于，所述深度可分离卷积，包括：将输入大小为DF×DF×N的特征图，转换为N个标准卷积核DK×DK×M，然后再将每个所述标准卷积核拆分为M个DK×DK×1的深度卷积和1 ×1×M逐点卷积，其卷积计算量公式如下： (DK·DK·M·DF·DF+M·DF·DF)·N；其中， DK·DK·M·DF·DF表示深度卷积计算量， M ·N·DF·DF表示逐点卷积计算量， DK表示卷积核大小， M是输入特征图的通道数， N 为输出特征层通道数。 8.根据权利要求2或4所述的人体目标识别方法，其特征在于，所述分组数为g组的分组卷积为将维度为H ×W×C1的输入特征图，按照通道数分为g组，进而得到维度为的分组后输入特征图；所述维度为H ×W×C1的输入特征图的卷积核大小为所述分组后输入特征图的维度为拼接出的最终特征图的维度为H ×W×C2，即所述步骤2.2)和步骤 3.1)拼接得到的主干最终特征图的维度和Neck特征处理最终特征图的维度均为H ×W×C2；其中， H为输入特征图的高度， W为输入特征图的宽度， C1为输入特征图的通道数， C2为最终特征图的通道数， K为分组卷积的卷积核长度值和宽度值；分组卷积的计算公式为 9.根据权利要求1所述的人体目标识别方法，其特征在于，所述步骤4)中的Ciou损失函数CiouLoss如下：其中， Distance_O2表示预测框与真实框两个中心点的欧式距离， Distance_C2表示预测框与真实框的最小外接矩形的对角线距离； γ为宽高比例， Iou为预测框与真实框的交联比，所述宽高比例γ函数如下：其中， wgt表示真实框的宽度， hgt表示真实框的高度， wp表示预测框的宽度， hp表示预测框的高度。 10.人体目标识别系统，其特征在于，包括人体目标运动图片采集模块、人体目标图片预处理模块、人体目标图片多角度融合模块、人体目标识别控制模块；所述人体目标运动图片采集模块，用于实时采集人体目标运动视频，并将采集到的人体目标运动视频中每一帧原始人体目标运动图片输入模型；所述人体目标运动图片预处理模块，用于对所述原始人体目标运动图片进行预处理；所述人体目标图片多角度融合模块，用于对预处理后的人体目标运动图片进行多尺度融合；所述人体目标识别控制模块，用于构建Ciou损失函数CiouLoss和宽高比例γ函数，评估权　利　要　求　书 2/3 页 3 CN 114913454 A 3

专利 一种人体目标识别方法及系统

专利一种人体目标识别方法及系统