安全公司报告
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111472336.4 (22)申请日 2021.12.0 6 (65)同一申请的已公布的文献号 申请公布号 CN 113869516 A (43)申请公布日 2021.12.31 (73)专利权人 深圳大学 地址 518060 广东省深圳市南 山区南海大 道3688号 (72)发明人 吴定明 周钰棋 陆克中 詹金颖  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 潘登 (51)Int.Cl. G06N 5/02(2006.01) G06N 20/00(2019.01)(56)对比文件 CN 112000689 A,2020.1 1.27 审查员 牛力敏 (54)发明名称 知识图谱嵌入模型训练方法、 装置、 电子设 备及介质 (57)摘要 本申请实施例公开了一种知识图谱嵌入表 示模型训练方法。 该方法包括: 获取知识图谱中 当前节点的邻接节点, 根据当前节 点和邻接节点 的初始向量表 示, 确定当前节 点和邻接节点之间 的第一关联向量; 通过聚合函数将所述第一关联 向量进行聚合, 得到当前节点与所有邻接节点之 间的第一关联聚合结果, 并将所述第一关联聚合 结果作为当前节点的更新向量表 示; 将所述更新 向量表示输入知识图谱嵌入表示模 型中, 得到各 节点的嵌入表 示。 以上技术方案中从多维度选择 节点的邻接节 点, 并将节点与其邻接节点之间的 关联信息进行聚合作为节点的向量表 示, 使模型 在训练时可以学习到更丰富的信息, 从而使 得到 的节点的嵌入式表示具有更优的空间和文本辨 别能力。 权利要求书2页 说明书12页 附图5页 CN 113869516 B 2022.05.20 CN 113869516 B 1.一种知识图谱嵌入表示模型训练方法, 其特 征在于, 所述方法包括: 获取知识图谱中当前节点的邻接节点, 根据当前节点和邻接节点的初始向量表示, 确 定当前节点和邻接节点之间的第一关联向量, 包括: 将当前节点和邻接节点的初始向量表示进行拼接, 得到第一 拼接向量; 根据当前节点和邻 接节点之间的空间邻 近度和文本相似度, 确定当前节点和邻 接节点 之间的关联信息; 将所述关联信 息与所述第一拼接向量相乘, 得到当前节点和邻 接节点之间的第 一关联 向量; 其中, 所述节点用于表征知识图谱中的实体; 通过聚合函数将所述第 一关联向量进行聚合, 得到当前节点与 所有邻接节点之间的第 一关联聚合结果, 并将所述第一关联聚合结果作为当前节点的更新向量表示; 将所述更新向量表示输入知识图谱嵌入表示模型中, 得到各节点的嵌入表示。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一关联聚合结果作为当前节 点的更新向量表示之后, 还 包括: 根据当前节点和邻 接节点的更新向量表示, 确定当前节点和邻 接节点之间的第 二关联 向量; 通过聚合函数将所述第 二关联向量进行聚合, 得到当前节点与 所有邻接节点之间的第 二关联聚合结果, 并将所述第二关联聚合结果作为当前节点的最终向量表示; 将所述最终向量表示输入知识图谱嵌入表示模型中, 得到各节点的嵌入表示。 3.根据权利要求1或2所述的方法, 其特征在于, 所述当前节点的邻 接节点, 包括在知识 图谱结构中与当前节点直接相连的邻接节点, 和/或, 在空间地理位置上与当前节点距离最 近的预设数量的邻接节点。 4.根据权利要求2所述的方法, 其特征在于, 所述根据当前节点和邻 接节点的更新向量 表示, 确定当前节点和邻接节点之间的第二关联向量, 包括: 将当前节点和邻接节点的更新向量表示进行拼接, 得到第二 拼接向量; 根据当前节点和邻 接节点之间的空间邻 近度和文本相似度, 确定当前节点和邻 接节点 之间的关联信息; 将所述关联信 息与所述第二拼接向量相乘, 得到当前节点和邻 接节点之间的第 二关联 向量。 5.根据权利要求2所述的方法, 其特征在于, 所述将所述最终向量表示输入知识图谱嵌 入表示模型中, 得到各节点的嵌入表示, 包括: 确定各节点的正样本集和负 样本集; 根据各节点的正样本集和负 样本集定义损失函数; 确定使损失函数达到最小值 时的最优参数, 并根据最优参数构建知识图谱嵌入表示模 型, 以用于确定各节点的嵌入表示。 6.根据权利要求5所述的方法, 其特征在于, 所述确定各节点的正样本集和负样本集, 包括: 确定知识图谱中各节点之间连线的归一化权重, 通过各节点在知识图谱中带权随机游 走预设长度, 生成各节点的正样本集; 若节点为地点节点, 则根据 该节点与其他地点节点的空间邻 近度确定该节点的负样本权 利 要 求 书 1/2 页 2 CN 113869516 B 2集; 若节点为非地点节点, 则从知识图谱中的其他所有节点中随机选取节点构 成该节点的 负样本集; 若节点负样本集中的样本已经在该节点的正样本集中, 则在该节点的负样本集 中舍弃该样本, 并重新进行选取。 7.一种知识图谱嵌入表示模型训练装置, 其特 征在于, 所述装置包括: 第一关联向量确定模块, 用于获取知识图谱中当前节点的邻接节点, 根据当前节点和 邻接节点的初始向量表示, 确定 当前节点和邻接节点之 间的第一关联向量; 其中, 所述节 点 用于表征知识图谱中的实体; 所述第一关联向量确定模块, 具体用于: 将当前节点和邻接节点的初始向量表示进行 拼接, 得到第一拼接向量; 根据当前节点和邻接节点之 间的空间邻近度和文本相似度, 确定 当前节点和邻接节点之间的关联信息; 将所述关联信息与所述第一拼接 向量相乘, 得到当 前节点和邻接节点之间的第一关联向量; 第一聚合结果确定模块, 用于通过聚合函数将所述第一关联向量进行聚合, 得到当前 节点与所有邻接节点之 间的第一关联聚合结果, 并将所述第一关联聚合结果作为当前节点 的更新向量表示; 第一模型训练模块, 用于将所述更新向量表示输入知识图谱嵌入表示模型中, 得到各 节点的嵌入表示。 8.一种电子设备, 其特 征在于, 所述电子设备包括: 一个或多个处 理器; 存储器, 用于存 储一个或多个程序; 当所述一个或多个程序被所述一个或多个处理器执行时, 所述一个或多个处理器实现 如权利要求1 ‑6中任一项所述的知识图谱嵌入表示模型训练方法。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执 行时实现如权利要求1 ‑6中任一项所述的知识图谱嵌入表示模型训练方法。权 利 要 求 书 2/2 页 3 CN 113869516 B 3

.PDF文档 专利 知识图谱嵌入模型训练方法、装置、电子设备及介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 知识图谱嵌入模型训练方法、装置、电子设备及介质 第 1 页 专利 知识图谱嵌入模型训练方法、装置、电子设备及介质 第 2 页 专利 知识图谱嵌入模型训练方法、装置、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:22:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。