(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210383320.4
(22)申请日 2022.04.12
(71)申请人 浙江大华 技术股份有限公司
地址 310053 浙江省杭州市滨江区滨安路
1187号
(72)发明人 江中毅 刘备 张宏 陈立力
周明伟
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
专利代理师 张恺宁
(51)Int.Cl.
G06V 10/762(2022.01)
G06K 9/62(2022.01)
G06V 20/54(2022.01)
G06V 40/16(2022.01)G06V 10/74(2022.01)
(54)发明名称
一种数据聚类方法、 装置、 计算机设备及存
储介质
(57)摘要
本申请提供一种数据聚类方法、 装置、 计算
机设备及存储介质, 用于解决数据聚类的准确性
较低的问题。 该方法包括: 获取各个第一聚类结
果; 基于预设的关联关系挖掘策略, 对所述各个
目标车辆 行驶数据, 以及在所述预设时间段内产
生的各个参考车辆行驶数据进行挖掘处理, 获得
目标车辆行驶数据与参考车辆行驶数据之间的
多个关联关系, 其中, 所述各个参考车辆行驶数
据各自包含的车牌数据, 与所述各个目标车辆行
驶数据各自包含的车牌数据匹配; 基于所述多个
关联关系和所述各个第一聚类结果, 对所述目标
车辆行驶数据进行目标聚类处理, 获得至少一个
目标聚类结果。
权利要求书4页 说明书18页 附图5页
CN 114743038 A
2022.07.12
CN 114743038 A
1.一种数据聚类方法, 其特 征在于, 包括:
获取各个第一聚类结果, 其中, 所述各个第一聚类结果是基于在预设时间段内产生的
各个目标车辆行驶数据各自包含的车辆行驶图像中, 位于车辆内部的人脸所在的人脸图像
区域, 对所述各个目标车辆行驶数据进行初始聚类处理获得的, 每个第一聚类结果包含至
少一个目标 车辆行驶数据;
基于预设的关联关系挖掘策略, 对所述各个目标车辆行驶数据, 以及在所述预设时间
段内产生的各个参考车辆行驶数据进 行挖掘处理, 获得目标车辆行驶数据与参考车辆行驶
数据之间的多个关联关系, 其中, 所述各个参考车辆行驶数据各自包含的车牌数据, 与所述
各个目标 车辆行驶数据各自包 含的车牌数据匹配;
基于所述多个关联关系和所述各个第 一聚类结果, 对所述目标车辆行驶数据进行目标
聚类处理, 获得至少一个目标聚类结果。
2.根据权利要求1所述的方法, 其特征在于, 在基于预设的关联关系挖掘策略, 对所述
各个目标车辆行驶数据, 以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘
处理, 获得目标 车辆行驶数据与参 考车辆行驶数据之间的多个关联关系之前, 还 包括:
获取所述各个目标车辆行驶数据各自包含的车辆行驶图像中, 包含人脸的车辆图像区
域对应的车牌数据;
针对所述各个目标车辆行驶数据各自包含的车牌数据, 分别在所述预设时间段内产生
的各个实时车辆行驶数据中, 选取包含的车辆行驶图像中车辆图像区域对应的车牌数据,
与相应目标车辆行驶数据包含的车牌数据相同的实时车辆行驶数据, 作为参考车辆行驶数
据。
3.根据权利要求1所述的方法, 其特征在于, 所述目标车辆行驶数据和所述参考车辆行
驶数据分别还 包括数据 产生时刻和数据 产生地址;
所述基于预设的关联关系挖掘策略, 对所述各个目标车辆行驶数据, 以及在所述预设
时间段内产生的各个参考车辆行驶数据进 行挖掘处理, 获得目标车辆行驶数据与参考车辆
行驶数据之间的多个关联关系, 包括:
将所述各个目标车辆行驶数据和所述各个参考车辆行驶数据, 分别作为综合车辆行驶
数据, 并基于包含的车牌数据和数据产生时刻所属时间区间, 对各个综合车辆行驶数据进
行分组处理, 针对每个车牌数据, 获得多个车辆行驶数据序列, 其中, 每个车辆行驶数据序
列包含的各综合车辆行驶数据按照数据 产生时刻排列;
针对每个车牌数据对应的多个车辆行驶数据 序列, 执行以下操作:
采用所述关联关系挖掘策略, 基于每个车辆行驶数据序列包含的综合车辆行驶数据的
数据产生地址, 分别对相应的多个车辆行驶数据序列进 行挖掘处理, 确定至少一个频繁项,
以及每个频繁项包含的综合车辆行驶数据的数据产生地址, 在相应的多个车辆行驶数据组
中出现的频 数, 其中, 所述频繁项包 含至少一个综合车辆行驶数据;
将获得的至少一个频繁项和相应的频 数, 作为相应车牌数据对应的关联关系。
4.根据权利要求1~3任一项所述的方法, 其特征在于, 基于所述多个关联关系和所述
各个第一聚类结果, 对所述各个目标车辆行驶数据进行目标聚类处理, 获得至少一个目标
聚类结果, 包括:
基于所述各个目标车辆行驶数据各自的车牌数据, 对所述各个第 一聚类结果进行重新权 利 要 求 书 1/4 页
2
CN 114743038 A
2整合处理, 获得多个第二聚类结果, 其中, 每个第二聚类结果中的各目标车辆行驶数据的车
牌数据相同, 且车辆行驶图像中位于车辆内部的人脸匹配;
基于所述多个关联关系和所述各个第 二聚类结果, 对所述各个目标车辆行驶数据进行
目标聚类处 理, 获得至少一个目标聚类结果。
5.根据权利要求4所述的方法, 其特征在于, 基于所述多个关联关系和所述各个第 二聚
类结果, 对所述各个目标车辆行驶数据进 行目标聚类处理, 获得至少一个目标聚类结果, 包
括:
针对所述各个第二聚类结果, 分别从第二聚类结果包含的目标车辆行驶数据中, 选取
与相应第二聚类结果的聚类质心之 间的相似度最大的目标车辆行驶数据, 作为相应第二聚
类结果对应的质心车辆行驶数据;
基于所述多个关联关系, 确定每两个质心车辆行驶数据之间的目标相似度;
针对目标相似度大于预设相似度条件的每两个质心车辆行驶数据各自对应的第二聚
类结果进行合并处 理, 获得至少一个目标聚类结果。
6.根据权利要求5所述的方法, 其特征在于, 所述目标车辆行驶数据还包括驾驶标识,
所述驾驶标识用于表征所述目标车辆行驶数据包含的车辆行驶图像中, 包含位于车辆内部
的人脸的人脸图像区域与车辆图像区域之 间的相对位置 关系, 所述驾驶标识包括主驾驶标
识和副驾驶标识;
所述针对所述各个第二聚类结果, 分别从第二聚类结果包含的目标车辆行驶数据中,
选取与相应第二聚类结果的聚类质心之 间的相似度最大的目标车辆行驶数据, 作为相应第
二聚类结果对应的质心车辆行驶数据, 包括:
针对所述各个第二聚类结果, 分别执 行以下操作:
从第二聚类结果包含的各目标车辆行驶数据中, 分别确定包含的驾驶标识为主驾驶标
识的目标 车辆行驶数据, 以及包 含的驾驶标识为副驾驶标识的目标 车辆行驶数据;
从包含主驾驶标识的目标车辆行驶数据中, 选取与相应第 二聚类结果的聚类质心之间
的相似度最大的目标 车辆行驶数据, 作为主质心车辆行驶数据;
从包含副驾驶标识的目标车辆行驶数据中, 选取与相应第 二聚类结果的聚类质心之间
的相似度最大的目标 车辆行驶数据, 作为副质心车辆行驶数据;
基于获得的主质心车辆行驶数据和副质心车辆行驶数据, 获得所述第 二聚类结果对应
的质心车辆行驶数据。
7.根据权利要求5所述的方法, 其特征在于, 每个关联关系对应一个车牌数据, 每个关
联关系包括至少一个频繁项, 每个频繁项包含至少一个目标车辆行驶数据或参考车辆行驶
数据, 所述频繁项 具有频数, 所述频数表征所述频繁项对应的数据产生地址, 在相同车牌数
据和数据产生时刻属于相同时间区间的目标车辆行驶数据和 参考车辆行驶数据中的出现
次数;
所述基于所述多个关联关系, 确定每两个质心车辆行驶数据之间的目标相似度, 包括:
针对每两个执 行车辆行驶数据, 执 行以下操作:
基于两个质心车辆行驶数据 各自包含的目标车辆行驶图像中, 包含位于车辆 内部的人
脸的人脸图像区域之间的相似度, 确定 两个质心车辆行驶数据之间的初始相似度;
基于所述两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间,权 利 要 求 书 2/4 页
3
CN 114743038 A
3
专利 一种数据聚类方法、装置、计算机设备及存储介质
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:33:26上传分享