(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111472336.4
(22)申请日 2021.12.0 6
(65)同一申请的已公布的文献号
申请公布号 CN 113869516 A
(43)申请公布日 2021.12.31
(73)专利权人 深圳大学
地址 518060 广东省深圳市南 山区南海大
道3688号
(72)发明人 吴定明 周钰棋 陆克中 詹金颖
(74)专利代理 机构 北京品源专利代理有限公司
11332
专利代理师 潘登
(51)Int.Cl.
G06N 5/02(2006.01)
G06N 20/00(2019.01)(56)对比文件
CN 112000689 A,2020.1 1.27
审查员 牛力敏
(54)发明名称
知识图谱嵌入模型训练方法、 装置、 电子设
备及介质
(57)摘要
本申请实施例公开了一种知识图谱嵌入表
示模型训练方法。 该方法包括: 获取知识图谱中
当前节点的邻接节点, 根据当前节 点和邻接节点
的初始向量表 示, 确定当前节 点和邻接节点之间
的第一关联向量; 通过聚合函数将所述第一关联
向量进行聚合, 得到当前节点与所有邻接节点之
间的第一关联聚合结果, 并将所述第一关联聚合
结果作为当前节点的更新向量表 示; 将所述更新
向量表示输入知识图谱嵌入表示模 型中, 得到各
节点的嵌入表 示。 以上技术方案中从多维度选择
节点的邻接节 点, 并将节点与其邻接节点之间的
关联信息进行聚合作为节点的向量表 示, 使模型
在训练时可以学习到更丰富的信息, 从而使 得到
的节点的嵌入式表示具有更优的空间和文本辨
别能力。
权利要求书2页 说明书12页 附图5页
CN 113869516 B
2022.05.20
CN 113869516 B
1.一种知识图谱嵌入表示模型训练方法, 其特 征在于, 所述方法包括:
获取知识图谱中当前节点的邻接节点, 根据当前节点和邻接节点的初始向量表示, 确
定当前节点和邻接节点之间的第一关联向量, 包括:
将当前节点和邻接节点的初始向量表示进行拼接, 得到第一 拼接向量;
根据当前节点和邻 接节点之间的空间邻 近度和文本相似度, 确定当前节点和邻 接节点
之间的关联信息;
将所述关联信 息与所述第一拼接向量相乘, 得到当前节点和邻 接节点之间的第 一关联
向量; 其中, 所述节点用于表征知识图谱中的实体;
通过聚合函数将所述第 一关联向量进行聚合, 得到当前节点与 所有邻接节点之间的第
一关联聚合结果, 并将所述第一关联聚合结果作为当前节点的更新向量表示;
将所述更新向量表示输入知识图谱嵌入表示模型中, 得到各节点的嵌入表示。
2.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一关联聚合结果作为当前节
点的更新向量表示之后, 还 包括:
根据当前节点和邻 接节点的更新向量表示, 确定当前节点和邻 接节点之间的第 二关联
向量;
通过聚合函数将所述第 二关联向量进行聚合, 得到当前节点与 所有邻接节点之间的第
二关联聚合结果, 并将所述第二关联聚合结果作为当前节点的最终向量表示;
将所述最终向量表示输入知识图谱嵌入表示模型中, 得到各节点的嵌入表示。
3.根据权利要求1或2所述的方法, 其特征在于, 所述当前节点的邻 接节点, 包括在知识
图谱结构中与当前节点直接相连的邻接节点, 和/或, 在空间地理位置上与当前节点距离最
近的预设数量的邻接节点。
4.根据权利要求2所述的方法, 其特征在于, 所述根据当前节点和邻 接节点的更新向量
表示, 确定当前节点和邻接节点之间的第二关联向量, 包括:
将当前节点和邻接节点的更新向量表示进行拼接, 得到第二 拼接向量;
根据当前节点和邻 接节点之间的空间邻 近度和文本相似度, 确定当前节点和邻 接节点
之间的关联信息;
将所述关联信 息与所述第二拼接向量相乘, 得到当前节点和邻 接节点之间的第 二关联
向量。
5.根据权利要求2所述的方法, 其特征在于, 所述将所述最终向量表示输入知识图谱嵌
入表示模型中, 得到各节点的嵌入表示, 包括:
确定各节点的正样本集和负 样本集;
根据各节点的正样本集和负 样本集定义损失函数;
确定使损失函数达到最小值 时的最优参数, 并根据最优参数构建知识图谱嵌入表示模
型, 以用于确定各节点的嵌入表示。
6.根据权利要求5所述的方法, 其特征在于, 所述确定各节点的正样本集和负样本集,
包括:
确定知识图谱中各节点之间连线的归一化权重, 通过各节点在知识图谱中带权随机游
走预设长度, 生成各节点的正样本集;
若节点为地点节点, 则根据 该节点与其他地点节点的空间邻 近度确定该节点的负样本权 利 要 求 书 1/2 页
2
CN 113869516 B
2集;
若节点为非地点节点, 则从知识图谱中的其他所有节点中随机选取节点构 成该节点的
负样本集; 若节点负样本集中的样本已经在该节点的正样本集中, 则在该节点的负样本集
中舍弃该样本, 并重新进行选取。
7.一种知识图谱嵌入表示模型训练装置, 其特 征在于, 所述装置包括:
第一关联向量确定模块, 用于获取知识图谱中当前节点的邻接节点, 根据当前节点和
邻接节点的初始向量表示, 确定 当前节点和邻接节点之 间的第一关联向量; 其中, 所述节 点
用于表征知识图谱中的实体;
所述第一关联向量确定模块, 具体用于: 将当前节点和邻接节点的初始向量表示进行
拼接, 得到第一拼接向量; 根据当前节点和邻接节点之 间的空间邻近度和文本相似度, 确定
当前节点和邻接节点之间的关联信息; 将所述关联信息与所述第一拼接 向量相乘, 得到当
前节点和邻接节点之间的第一关联向量;
第一聚合结果确定模块, 用于通过聚合函数将所述第一关联向量进行聚合, 得到当前
节点与所有邻接节点之 间的第一关联聚合结果, 并将所述第一关联聚合结果作为当前节点
的更新向量表示;
第一模型训练模块, 用于将所述更新向量表示输入知识图谱嵌入表示模型中, 得到各
节点的嵌入表示。
8.一种电子设备, 其特 征在于, 所述电子设备包括:
一个或多个处 理器;
存储器, 用于存 储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时, 所述一个或多个处理器实现
如权利要求1 ‑6中任一项所述的知识图谱嵌入表示模型训练方法。
9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执
行时实现如权利要求1 ‑6中任一项所述的知识图谱嵌入表示模型训练方法。权 利 要 求 书 2/2 页
3
CN 113869516 B
3
专利 知识图谱嵌入模型训练方法、装置、电子设备及介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:22:37上传分享