(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210319737.4
(22)申请日 2022.03.29
(71)申请人 哈尔滨工业大 学 (深圳)
地址 518000 广东省深圳市南 山区桃源街
道深圳大 学城哈尔滨工业大 学校区
(72)发明人 王鸿鹏 张瑞霖 苗振国 郑海阳
(74)专利代理 机构 深圳市添源创鑫知识产权代
理有限公司 4 4855
专利代理师 姜书新
(51)Int.Cl.
G06V 10/40(2022.01)
G06V 10/762(2022.01)
G06V 10/776(2022.01)
G06K 9/62(2022.01)
(54)发明名称
基于空间向量分解的边界剥离聚类方法及
系统
(57)摘要
本发明提供了一种基于空间向量分解的边
界剥离聚类方法及系统, 该边界剥离聚类方法包
括: 步骤1, 输入步骤: 输入数据集 合
; 步骤2, 边界剥离步骤: 根
据对象邻域 分布特征判别对象类型, 以剥离边界
点; 步骤3, 簇骨架构建步骤: 依据传递闭包关系
确定簇的骨架; 步骤4, 边界关联步骤: 建立边界
与簇骨架之间的隶属关系完成聚类; 步骤5, 输出
步骤: 输出聚类结果。 本发明的有益效果是: 本发
明不仅解决了现有边界剥离聚类倾向于分布均
匀、 球形簇的局限, 同时提升了本发明在复杂分
布、 高维数据下的表现。
权利要求书2页 说明书16页 附图4页
CN 115375906 A
2022.11.22
CN 115375906 A
1.一种基于空间向量分解的边界剥离聚类方法, 其特 征在于, 包括如下步骤:
步骤1, 输入步骤: 输入数据集 合X={x1,x2,x3,...,xn}∈Rm×n;
步骤2, 边界剥离步骤: 根据对象邻域分布特 征判别对象类型, 以剥离边界点;
步骤3, 簇骨架构建步骤: 依据传递闭包关系确定 簇的骨架;
步骤4, 边界关联步骤: 建立 边界与簇骨架之间的隶属关系完成聚类;
步骤5, 输出步骤: 输出聚类结果。
2.根据权利要求1所述的边界剥离聚类方法, 其特 征在于, 所述 步骤2包括如下步骤:
步骤21: 计算密度ρi;
步骤22: 计算近邻向量范 数||vi||p;
步骤23: 计算 边界置信
3.根据权利 要求2所述的边界剥离聚类方法, 其特征在于, 在所述步骤21中, 根据式(7)
计算密度ρi;
k表示近邻参数, Nk(xi)表示对象xi的k近邻集合; d(xi,xj)表示对象xi和xj之间的L2距
离。
4.根据权利 要求3所述的边界剥离聚类方法, 其特征在于, 在所述步骤22中, 根据式(6)
计算近邻向量范 数||vi||p;
xid、 xjd分别表示对象xi和xi在维度d上的取值, 即第d个属性值; P代表P范式; xj代表对象
j。
5.根据权利 要求4所述的边界剥离聚类方法, 其特征在于, 在所述步骤23中, 根据式(8)
计算边界置信BCi;
6.根据权利要求1至5任一项所述的边界剥离聚类方法, 其特征在于, 所述步骤3包括如
下步骤:
步骤31: 根据式(9)将数据集 合X分割为 边界集XB和核心集XCore,
其中τ∈[0,1]为边界权重,
为降序队列; ξ(xi)是一个指示变量, 如果ξ(xi)等于1, 表
明该对象为边界对象, 如果ξ(xi)为0, 则该对象属于核心对象; BCi表示对象的边界置信; n表
示数据集中对象数量;
步骤32: 根据式(10)建立对象间的有向连通图, 遍历矩阵, 搜索连通区域,权 利 要 求 书 1/2 页
2
CN 115375906 A
27.根据权利要求6所述的边界剥离聚类方法, 其特征在于, 在所述步骤4中, 根据式
(11), 划分边界对象, 建立 边界与簇骨架的关联,
φi指定了边界对象xi∈XB的隶属信息 。
8.一种基于空间向量分解的边界剥离聚类系统, 其特征在于, 包括: 存储器、 处理器以
及存储在所述存储器上的计算机程序, 所述计算机程序配置为由所述处理器调用时实现权
利要求1-7中任一项所述 边界剥离聚类方法的步骤。
9.一种计算机可读存储介质, 其特征在于: 所述计算机可读存储介质存储有计算机程
序, 所述计算机程序配置为由处理器调用时实现权利要求 1-7中任一项 所述的边界剥离聚
类方法的步骤。权 利 要 求 书 2/2 页
3
CN 115375906 A
3
专利 基于空间向量分解的边界剥离聚类方法及系统
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:36:19上传分享