(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211110371.6
(22)申请日 2022.09.13
(71)申请人 浙江网商银行股份有限公司
地址 310012 浙江省杭州市西湖区古 荡街
道西溪路556号阿里中心D幢9层、 E幢
3-8层
(72)发明人 李江涛 吴亚熙 钟自凤 陈林勋
(74)专利代理 机构 北京智信禾专利代理有限公
司 11637
专利代理师 刘晓楠
(51)Int.Cl.
G06F 16/2458(2019.01)
G06F 16/28(2019.01)
(54)发明名称
关系挖掘方法以及装置
(57)摘要
本说明书实施例提供关系挖掘方法以及装
置, 其中所述关系挖掘方法包括: 获取第一对象
和第二对象的对象信息; 对第一对象和第二对象
的对象信息分别进行向量表征, 获得第一对象 的
第一嵌入向量和第二对象的第二嵌入向量, 其
中, 向量表征融合了对象属性特征和对象图特
征; 计算第一嵌入向量与第二 嵌入向量之间的相
似度; 根据相似度, 识别第一对象和第二对象之
间是否存在上下游关系。 通过对获取的第一对象
和第二对象的对象信息进行向量表征得到融合
了对象属性特征和对象图特征的第一嵌入向量
和第二嵌入向量, 通过计算第一嵌入向量和第二
嵌入向量的相似度, 识别第一对象和第二对象之
间是否存在上下游关系, 使识别出来的是否存在
上下游关系的结果更加准确。
权利要求书3页 说明书17页 附图7页
CN 115438098 A
2022.12.06
CN 115438098 A
1.一种关系挖掘方法, 包括:
获取第一对象和第二对象的对象信息;
对所述第一对象和第 二对象的对象信 息分别进行向量表征, 获得所述第 一对象的第 一
嵌入向量和所述第二对 象的第二嵌入向量, 其中, 所述向量表征融合了对 象属性特征和对
象图特征;
计算所述第一嵌入向量与所述第二嵌入向量之间的相似度;
根据所述相似度, 识别所述第一对象和所述第二对象之间是否存在上 下游关系。
2.根据权利要求1所述的方法, 所述对所述第一对象和第二对象的对象信息分别进行
向量表征, 获得 所述第一对象的第一嵌入向量和所述第二对象的第二嵌入向量, 包括:
将所述第一对象和第二对象的对象信息输入预训练的关系识别模型, 其中, 所述关系
识别模型 具有包含两个向量表征通道的双塔结构;
利用第一向量表征通道的特征提取层对所述第 一对象的对象信 息进行特征提取, 获得
所述第一对象的第一对象特征, 利用所述第一向量表征通道的嵌入层 对所述第一对象特征
进行嵌入计算, 获得 所述第一对象的第一嵌入向量;
利用第二向量表征通道的特征提取层对所述第 二对象的对象信 息进行特征提取, 获得
所述第二对象的第二对象特征, 利用所述第二向量表征通道的嵌入层 对所述第二对象特征
进行嵌入计算, 获得 所述第二对象的第二嵌入向量。
3.根据权利要求2所述的方法, 所述特征提取层包括属性特征提取子模型和图特征提
取子模型;
所述利用第 一向量表征通道的特征提取层对所述第 一对象的对象信 息进行特征提取,
获得所述第一对象的第一对象特 征, 包括:
将所述第一对象的对象信息分别输入第一向量表征通道的属性特征提取子模型和图
特征提取子模型, 获得 所述第一对象的第一对象属性特 征和第一对象图特 征;
对所述第一对象属性特征和所述第 一对象图特征进行特征融合, 得到所述第 一对象的
第一对象特 征;
所述利用第 二向量表征通道的特征提取层对所述第 二对象的对象信 息进行特征提取,
获得所述第二对象的第二对象特 征, 包括:
将所述第二对象的对象信息分别输入第二向量表征通道的属性特征提取子模型和图
特征提取子模型, 获得 所述第二对象的第二对象属性特 征和第二对象图特 征;
对所述第二对象属性特征和所述第 二对象图特征进行特征融合, 得到所述第 二对象的
第二对象特 征。
4.根据权利要求2或3所述的方法, 在所述将所述第 一对象和第 二对象的对象信 息输入
预训练的关系识别模型之前, 还 包括:
构建样本集, 其中, 所述样本集包括多个样本对, 所述样本对携带有表征所述样本对中
两个样本对象之间是否存在上 下游关系的关系标签;
基于所述多个样本对中样本对象的对象信 息以及关系标签, 对具有所述双塔结构的预
设深度学习网络进行训练, 获得训练后的关系识别模型。
5.根据权利要求4所述的方法, 所述基于所述多个样本对中样本对象的对象信息以及
关系标签, 对具有所述双塔结构的预设深度学习网络进行训练, 获得训练后的关系识别模权 利 要 求 书 1/3 页
2
CN 115438098 A
2型, 包括:
提取第一样本对, 获得所述第一样本对中两个样本对象的对象信息以及特定关系标
签, 其中, 所述第一样本对为所述样本集中的任一样本对;
将所述第一样本对中两个样本对象的对象信息输入具有所述双塔结构的预设深度学
习网络, 获得所述第一样本对中两个样本对 象的嵌入向量, 并计算所述第一样本对中两个
样本对象的嵌入向量之间的相似度;
根据所述相似度和所述特定关系标签, 计算损失值;
基于所述损失值调 整所述预设深度 学习网络的网络参数, 并返回执行所述提取第 一样
本对, 获得 所述第一样本对中两个样本对象的对象信息以及特定关系标签的步骤;
在达到训练停止条件的情况下, 确定完成对所述预设深度学习 网络的训练, 获得关系
识别模型。
6.根据权利要求 4或5所述的方法, 所述构建样本集, 包括:
获取多个样本对象的对象行为数据;
根据所述多个样本对象的对象行为数据, 确定各样本对象间的上 下游关系;
基于具有上下游关系的样本对象, 构建正样本对, 其中, 所述正样本对携带有表征存在
上下游关系的关系标签;
对具有上下游关系的一对样本对象中的任一个进行替换, 构建负样本对, 其中, 所述负
样本对携带有表征不存在上 下游关系的关系标签;
基于所述 正样本对和所述负 样本对, 构建样本集。
7.根据权利要求1所述的方法, 所述获取第一对象和第二对象的对象信息, 包括:
获取第一对象库和第二对象库, 其中, 所述第 一对象库包括多个第一对象的对象信 息,
所述第二对象库包括多个第二对象的对象信息;
从所述第一对象库中提取任一第 一对象的对象信 息, 从所述第 二对象库中提取任一第
二对象的对象信息;
所述根据所述相似度, 识别所述第一对象和所述第二对象之间是否存在上下游关系,
包括:
根据计算得到的多个相似度, 确定相似度达到预设条件的第 一对象和第 二对象之间存
在上下游关系。
8.根据权利要求7 所述的方法, 在所述获取第一对象库和第二对象库之前, 还 包括:
获取全量对象的对象信息;
对所述全量对象的对象信 息进行向量表征, 获得所述全量对象作为上游对象的第 三嵌
入向量以及所述全量对象作为下游对象的第四嵌入向量;
所述对所述第 一对象和第 二对象的对象信 息分别进行向量表征, 获得所述第 一对象的
第一嵌入向量和所述第二对象的第二嵌入向量, 包括:
将所述第一对象的对象信 息与作为上游对象的全量对象的对象信 息进行匹配, 确定匹
配的全量对象的第三嵌入向量作为所述第一对象的第一嵌入向量;
将所述第二对象的对象信 息与作为下游对象的全量对象的对象信 息进行匹配, 确定匹
配的全量对象的第四嵌入向量作为所述第二对象的第二嵌入向量。
9.根据权利要求1或7所述的方法, 所述第一对象为上游企业, 所述第二对象为下游企权 利 要 求 书 2/3 页
3
CN 115438098 A
3
专利 关系挖掘方法以及装置
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:14上传分享