(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210205730.X
(22)申请日 2022.03.03
(71)申请人 北京百度网讯科技有限公司
地址 100089 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 陈圣奇
(74)专利代理 机构 北京乐知新创知识产权代理
事务所(普通 合伙) 11734
专利代理师 陈婷婷
(51)Int.Cl.
G06V 40/16(2022.01)
G06K 9/62(2022.01)
G06V 10/762(2022.01)
(54)发明名称
一种人脸聚类的方法、 装置、 设备及存储介
质
(57)摘要
本公开提供了一种人脸聚类的方法、 装置、
设备以及存储介质, 涉及数据图形处理技术领
域, 尤其涉及人工智能和人脸识别技术领域。 具
体实现方案为: 首先, 获取批量图像的代表性人
脸特征, 形成代表性人脸特征集; 之后, 使用结合
了人脸特征在特征空间的邻域结构特性的聚类
算法对所述代表性人脸特征集, 进行微批量聚
类, 得到人脸分组; 然后, 将所得到的人脸 分组合
并到存量类簇的人脸分组中。 如此, 可实现不易
偏移, 更为鲁棒的增量人脸聚类 。
权利要求书3页 说明书12页 附图5页
CN 114612967 A
2022.06.10
CN 114612967 A
1.一种人脸聚类的方法, 包括:
获取批量图像的代 表性人脸特 征, 形成代 表性人脸特 征集;
使用第一聚类算法对所述代表性人脸特征集, 进行微批量聚类, 得到第 一人脸分组, 所
述第一聚类算法结合了人脸特 征在特征空间的邻域结构特性;
获取第二人脸分组, 所述第二人脸分组为存量类簇形成的人脸分组;
根据第二聚类算法将所述第一人脸分组合并至所述第二人脸分组。
2.根据权利要求1所述的方法, 其中, 所述获取批量图像的代表性人脸特征, 形成代表
性人脸特 征集, 包括:
获取所述批量图像中的一张图像;
对所述图像进行 人脸特征提取, 得到人脸特 征;
对所述人脸特 征进行质量评价, 得到质量评价得分;
若所述质量评价得分大于质量阈值, 则将所述人脸特征确定为代表性人脸特征, 将所
述代表性人脸特 征, 加入到所述代 表性人脸特 征集。
3.根据权利要求2所述的方法, 还 包括:
若所述质量评价得分小于等于质量阈值, 则舍弃 所述人脸特 征。
4.根据权利要求2所述的方法, 还 包括:
使用第三聚类算法对所述代表性人脸特征进行快速聚类, 得到所述代表性人脸特征所
属的类簇 。
5.根据权利要求4所述的方法, 其中, 所述使用第 三聚类算法对所述代表性人脸特征进
行快速聚类, 得到所述代 表性人脸特 征所属的第一人脸分组, 包括:
计算所述代 表性人脸特 征与各存量类簇之间的距离;
根据所述与各存量类簇之间的距离, 对所述代表性人脸特征进行聚类, 得到所述代表
性人脸特 征所属的第一人脸分组。
6.根据权利要求1所述的方法, 其中, 所述使用第一聚类算法对所述代表性人脸特征
集, 进行微批量聚类, 得到第一人脸分组, 包括:
根据所述代表性人脸特征集和第 一聚类算法, 计算高置信度下的各类簇的代表点和中
心表征;
根据所述代表性人脸特征集和第 一聚类算法, 计算低置信度下的各类簇的代表点和中
心表征;
根据所述低置信度下的各类簇的代表点和中心表征, 确定所述代表性人脸特征集中各
代表性人脸特 征所属的候选类簇;
根据所述高置信度下的各类簇的代表点和中心表征, 对各代表性人脸特征所属的候选
类簇进行筛 选, 得到各代 表性人脸特 征所属的第二人脸分组。
7.根据权利要求6所述的方法, 还 包括:
保存所述代 表点和所述代 表点所对应的图像。
8.根据权利要求1所述的方法, 其中, 所述第一聚类算法包括改进后的DBSCAN算法, 所
述DBSCAN算法增加了预先计算聚类初始点、 邻域高置信度半径和邻域低置信度半径的步
骤, 并在聚类过程中以所述预 先计算的聚类初始点作为 起始点, 进行聚类。
9.根据权利要求8所述的方法, 其中, 邻域高置信度半径和邻域低置信度半径为可调整权 利 要 求 书 1/3 页
2
CN 114612967 A
2的模型参数。
10.根据权利要求1所述的方法, 其中, 所述根据第二聚类算法将所述第一人脸分组合
并至所述第二人脸分组, 包括:
获取第一人脸分组中的一个 类簇;
计算所述类簇的高置信中心 表征与所述第二人脸分组中各存量类簇的第一中心 距离;
若所述第一中心 距离满足第一聚类条件, 则将所述类簇合并至相应的存量类簇 。
11.根据权利要求10所述的方法, 还 包括:
若所述第一中心距离不满足第 一聚类条件, 则 计算所述类簇的低置信中心表征与 所述
第二人脸分组中各存量类簇的第二中心 距离;
若所述第二中心 距离满足第二聚类条件, 则将所述类簇合并至相应的存量类簇 。
12.根据权利要求1 1所述的方法, 还 包括:
若所述第二中心距离不满足第 二聚类条件, 则 计算所述类簇的低置信中心表征与 所述
第二人脸分组中各存量类簇的代 表点;
若所述代 表点满足第三聚类条件, 则将所述类簇合并至相应的存量类簇 。
13.根据权利要求12所述的方法, 还 包括:
若所述代表点不满足第三聚类条件, 则获取类簇的大小, 若所述类簇的大小大于尺寸
阈值, 则将所述类簇作为 一个新的类簇, 添加至所述第二人脸分组。
14.根据权利要求13所述的方法, 还 包括:
若所述类簇的大小小于等于尺寸阈值, 则获取所述类簇的时间戳和过期时限, 若所述
类簇超期, 则 删除所述类簇 。
15.一种人脸聚类的装置, 包括:
代表性人脸特征集获取模块, 用于获取批量图像的代表性人脸特征, 形成代表性人脸
特征集;
微批量聚类模块, 用于使用第 一聚类算法对所述代表性人脸特征集, 进行微批量聚类,
得到第一人脸分组, 所述第一聚类算法结合了人脸特 征在特征空间的邻域结构特性;
存量类簇获取模块, 用于获取第二人脸分组, 所述第二人脸分组为存量类簇形成的人
脸分组;
类簇合并模块, 用于根据第二聚类算法将所述第一人脸分组合并至所述第二人脸分
组。
16.根据权利要求15所述的装置, 其中, 代 表性人脸特 征集获取模块, 包括:
图像获取子模块, 用于获取 所述批量图像中的一张图像;
人脸特征提取子模块, 用于对所述图像进行 人脸特征提取, 得到人脸特 征;
质量评价子模块, 用于对所述人脸特 征进行质量评价, 得到质量评价得分;
代表性人脸特征集形成子模块, 用于若所述质量评价得分大于质量阈值, 则将所述人
脸特征确定为代 表性人脸特 征, 将所述代 表性人脸特 征, 加入到所述代 表性人脸特 征集。
17.根据权利要求15所述的装置, 其中, 所述 微批量聚类模块包括:
高置信度计算子模块, 用于根据所述代表性人脸特征集和第一聚类算法, 计算高置信
度下的各类簇的代 表点和中心 表征;
低置信度计算子模块, 用于根据所述代表性人脸特征集和第一聚类算法, 计算低置信权 利 要 求 书 2/3 页
3
CN 114612967 A
3
专利 一种人脸聚类的方法、装置、设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:30:34上传分享