(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210313455.3
(22)申请日 2022.03.28
(71)申请人 南京邮电大 学
地址 210003 江苏省南京市 鼓楼区新模范
马路66号
(72)发明人 张晖 李可欣 赵海涛 朱洪波
(74)专利代理 机构 南京经纬专利商标代理有限
公司 32200
专利代理师 姜慧勤
(51)Int.Cl.
G06V 20/17(2022.01)
G06V 10/762(2022.01)
G06V 20/40(2022.01)
(54)发明名称
一种基于锚框最优聚类的YOLOv5园林异常
目标识别方法
(57)摘要
本发明公开了一种基于锚框最优聚类的
YOLOv5园林异常目标识别方法, 包括: 采集园林
垃圾样本图像, 并对园林垃圾样本图像进行标
注, 构建园林垃圾图像数据集; 利用改进的K ‑
means算法对园林垃圾图像数据集进行锚框聚
类, 得到最优的9个锚框; 根据最优的9个锚框设
置YOLOv5网络模型的锚框尺寸, 并对YOLOv5网络
模型进行训练, 得到训练好的YOLOv5网络模型,
利用训练好的YOLOv5网络模型实现园林垃圾识
别。 在智慧园林场景中, 利用本发明的方法, 可以
将无人机拍摄的视频和图片信息中的粘连的垃
圾精准的识别出来, 提高了垃圾识别的召回率和
准确率, 大大减轻了园林中人力和物力的投入,
减少了人工 巡检的工作。
权利要求书3页 说明书7页 附图2页
CN 114913438 A
2022.08.16
CN 114913438 A
1.一种基于锚框最优聚类的YOLOv5园林异常目标识别方法, 其特征在于, 包括如下步
骤:
步骤1, 采集园林垃圾样本图像, 并对园林垃圾样本图像进行标注, 构建园林垃圾图像
数据集;
步骤2, 利用改进的K ‑means算法对园林垃圾图像数据集进行锚框聚类, 得到最优的9个
锚框;
步骤3, 根据最优的9个锚框设置YOLOv5网络模型的锚框尺寸, 并对YOLOv5网络模型进
行训练, 得到训练好的YOLOv5网络模型, 利用训练好的YOLOv5网络模型实现园林 垃圾识别。
2.根据权利要求1所述的基于锚框最优聚类的YOLOv5园林异常目标识别方法, 其特征
在于, 所述步骤1 中, 在对园林垃圾样 本图像进 行标注前, 对园林垃圾样 本图像进 行平移、 旋
转和滤波预处 理, 再通过Label Img进行标注。
3.根据权利要求1所述的基于锚框最优聚类的YOLOv5园林异常目标识别方法, 其特征
在于, 所述 步骤2的具体过程如下:
步骤2.1, 对园林 垃圾图像数据集中的每张图像进行去 背景操作;
步骤2.2, 对于去 背景后的任意 一张图像qm, 根据以下公式找到图像的第一个聚类中心:
其中, P表示去除背景后, 图像中的所有像素点的个数; Hi表示第i个像素点pi的色调分
量值;
表示去背景操作前, 对每张 图像转换颜色空间后 得到的图像中所有像素点的色调
分量的平均值;
步骤2.3, 找到下一个聚类中心, 具体如下:
计算图像qm中每个像素点pi到目前已选出来的所有聚类中心的最短多维融合距离, 计
算公式如下:
其中, D(pi)表示像素点pi到目前已选出来所有的聚类中心的最短多维融合距 离, Dk(pi)
表示像素点pi到聚类中心ck的多维融合距离, K表 示目前已选出来的所有聚类中心个数; Hi、
Hk分别表示像素点pi的色调分量、 聚类中心ck的色调分量, (xi,yi)表示像素点pi相对于整个
图像的坐标, (xk,yk)表示聚类中心ck相对于整个图像的坐标, 整个图像以左上角为坐标原
点, 宽为x轴, 长为y轴, 一个 像素为一个单位;
计算每个像素点pi成为下一个聚类中心的概 率, 其概率用P(pi)表示, 计算公式如下:
按照概率的大小决定其概率范围的大小, 并将所有的概率范围随机依次分布到0 ‑1之
间, 在0‑1范围内产生一个随机数, 选取随机数所在的概率范围对应的像素点作为下一个聚
类中心;权 利 要 求 书 1/3 页
2
CN 114913438 A
2步骤2.4, 根据基于聚类评价系数的迭代终止条件判断是否需要选取新的聚类 中心, 如
果需要则重复步骤2.3;
定义聚类评价系数f, 根据聚类评价系数来决定聚类 中心的个数, 聚类评价系数的公式
如下:
其中, f(K)表示目前已选出K个聚类中心时的聚类评价系数; μK表示每个像素点pi到当
前已有聚类中心之间的最短多维融合距 离的均值;
表示每个像 素点pi到当前已有聚类中
心之间的最短多维融合距离的方差;
基于聚类评价系数的迭代终止条件分为以下三种情况:
情况1, 按照步骤2.3的过程增加一个聚类中心, 增加后的聚类中心个数为K+1, 增加后
的聚类评价系数为f(K+1), 增加后像素的聚合程度增加, 说明增加后聚类效果更好, 当增加
的程度超过 ε, 即f(K) ‑f(K+1)≥ε 时, 需要继续增 加, 其中, ε为大于 0的阈值;
情况2, 按照步骤2.3的过程增加一个聚类中心, 增加后的聚类中心个数为K+1, 增加后
的聚类评价系数为f(K+1), 当增加后像素的聚合程度增加范 围在(0, ε )之间, 即0<f(K) ‑f
(K+1)< ε 时, 停止增 加, 最终的聚类中心个数为K+1;
情况3, 按照步骤2.3的过程增加一个聚类中心, 增加后的聚类中心个数为K+1, 增加后
的聚类评价系数为f(K+1), 当f(K) ‑f(K+1)<0时, 停止增 加, 最终的聚类中心个数为K;
步骤2.5, 找到所有的聚类 中心后, 计算图像中某像素点到各个聚类 中心的多维融合距
离, 将该像素点分到最短多维融合距离所对应的聚类中心的类别中;
步骤2.6, 对于新增加像素点的类别重新计算聚类中心, 具体为: 设园林垃圾图像数据
集S中最大垃圾标记的尺寸为Wmax、 Lmax, 则其对角线长度为
新增加像素
点的类别的聚类中心当前为c, 若新增加的像素点到当前聚类中心c的欧氏距离大于Rmax, 则
更新后的聚类中心仍为c, 若新增加的像素点到当前聚类中心的欧氏距离小于Rmax, 则更新
后的聚类中心为
分别为该类别中所有像素点横坐标与纵坐标的平均值, 公式
如下:
其中, N表示该类别当前像素点的个数, xn、 yn分别为该类别中第n个像素点的横、 纵坐标
值;
步骤2.7, 重复步骤2.5和2.6, 直到聚类中心的位置不再发生变化;
步骤2.8, 根据每个类别中所有像素点的坐标最值xmin、 xmax、 ymin、 ymax, 确定锚框的上下
左右四个边界, 得到锚框;
步骤2.9, 对去 背景后的数据集 Q中每张图像进行步骤2.2到2.8操作, 得到所有的锚框;权 利 要 求 书 2/3 页
3
CN 114913438 A
3
专利 一种基于锚框最优聚类的YOLOv5园林异常目标识别方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:32:56上传分享