(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111641675.0
(22)申请日 2021.12.2 9
(71)申请人 合肥讯飞数码科技有限公司
地址 230088 安徽省合肥市高新区望江西
路666号人工智能云服 务平台研发楼
(72)发明人 徐承 张浩宇 吴飞 方四安
柳林
(74)专利代理 机构 北京磐华捷成知识产权代理
有限公司 1 1851
专利代理师 谢栒
(51)Int.Cl.
G06Q 10/04(2012.01)
G06K 9/62(2022.01)
G06F 40/30(2020.01)
G06F 16/36(2019.01)G06F 16/35(2019.01)
(54)发明名称
用于预测未来事件的方法、 系统、 计算设备
和可读介质
(57)摘要
本发明公开了用于预测未来事件的方法、 系
统、 计算设备和可读介质, 方法包括: 获取要预测
的未来事件的四元组中的三元素, 所述三元素包
括时间戳、 主体要素和类型要素, 其中所述四元
组中的客体要素是未知的; 对所述时间戳进行编
码, 获取所述时间戳的时间向量表示; 使用经训
练的预训练语言模型和经训练的图神经网络模
型分别得到所述主体要素的主体向量表示和所
述类型要素的类型向量表示; 以及基于所述时间
向量表示、 主体向量表示和类型向量表示, 得到
对所述未来事件的客体要素的预测结果。 本发明
能够获取实体节点和事件类型的语义表示, 增强
了语义表达能力, 并且能够预测未来可能发生的
新事件。
权利要求书2页 说明书11页 附图4页
CN 114462673 A
2022.05.10
CN 114462673 A
1.一种用于预测未来事 件的方法, 其特 征在于, 所述方法包括:
获取要预测的未来事件的四元组中的三元素, 所述三元素包括时间戳、 主体要素和类
型要素, 其中所述四元组中的客体要素 是未知的;
对所述时间戳进行编码, 获取 所述时间戳的时间向量表示;
使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素的
主体向量表示和所述类型要素的类型向量表示; 以及
基于所述时间向量表示、 主体向量表示和类型向量表示, 得到对所述未来事件的客体
要素的预测结果。
2.如权利要求1所述的方法, 其特 征在于, 其中对所述时间戳进行编码, 包括:
对所述时间戳中的年、 月、 日分别进行编码, 得到所述 年、 月、 日各自的向量表示; 以及
对所述年、 月、 日各自的向量表示进行融合, 得到所述时间戳的时间向量表示。
3.如权利要求1所述的方法, 其特征在于, 其中使用经训练 的预训练语言模型和经训练
的图神经网络模型 得到所述主体要素的主体向量表示, 包括:
使用经训练的预训练语言模型 得到所述主体要素的文本语义向量;
使用经训练的图神经网络模型 得到所述主体要素的图结构语义向量; 以及
将所述主体要素的文本语义向量和图结构语义向量进行融合, 得到所述主体要素的主
体向量表示。
4.如权利要求1所述的方法, 其特征在于, 其中使用经训练 的预训练语言模型和经训练
的图神经网络模型 得到所述类型要素的类型向量表示, 包括:
使用经训练的预训练语言模型 得到所述类型要素的文本语义向量;
使用经训练的图神经网络模型 得到所述类型要素的图结构语义向量; 以及
将所述类型要素的文本语义向量和图结构语义向量进行融合, 得到所述类型要素的类
型向量表示。
5.如权利要求1所述的方法, 其特征在于, 其中基于所述时间向量表示、 主体向量表示
和类型向量表示, 得到对所述未来事 件的客体要素的预测结果, 包括:
基于注意力机制对所述时间向量表示、 主体向量表示和类型向量表示进行融合, 得到
所述未来事 件的事件向量表示; 以及
基于所述事 件向量表示得到对所述未来事 件的客体要素的预测结果。
6.如权利要求1所述的方法, 其特征在于, 所述方法还包括: 采用包含外部知识 的训练
数据对预训练模型进行训练, 得到所述经训练的预训练语言模型。
7.如权利要求6所述的方法, 其特征在于, 所述包含外部知识的训练数据通过以下步骤
获得:
采用实体链接算法获取存储的历史事件的四元组的主体要素在领域知识图谱中的相
应的实体节点;
利用所述实体节点与所述实体节点的相关知识组成知识三元组, 作为所述外 部知识;
基于所述知识三元组和与 所述历史事件的三元组从语料库中检索相关文本, 其中所述
历史事件的三元组由所述历史事 件的四元组去掉时间戳而得到; 以及
对所述相关文本进行处 理, 得到所述包 含外部知识的训练数据。
8.如权利要求7所述的方法, 其特征在于, 其中所述实体节点的相关知识包括所述实体权 利 要 求 书 1/2 页
2
CN 114462673 A
2节点的一跳之内的知识。
9.如权利要求7 所述的方法, 其特 征在于, 其中对所述相关文本进行处 理, 包括:
将所述相关文本中包含的与所述知识三元组和所述历史事件的三元组相对应的主体
要素和客体要素中的至少一个作为训练数据的标签。
10.如权利要求6所述的方法, 其特征在于, 其中对预训练模型进行训练包括: 将所述预
训练模型训练为预测两个句子是否来自同一段落。
11.如权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
采用实体链接算法获取存储的历史事件的四元组的主体要素在领域知识图谱中的相
应的实体节点;
利用所述实体节点与所述实体节点的相关知识组成知识三元组;
将所述历史事 件的四元组去掉时间戳, 得到所述历史事 件的历史事 件图谱;
将所述知识三元组与所述历史事 件图谱相结合, 得到经 更新的历史事 件图谱; 以及
利用所述经更新的历史事件图谱作为训练数据对图神经网络模型进行训练, 得到所述
经训练的图神经网络模型。
12.一种用于预测未来事 件的系统, 其特 征在于, 所述系统包括:
处理器, 用于使用一个或更多个神经网络:
获取要预测的未来事件的四元组中的三元素, 所述三元素包括时间戳、 主体要素和类
型要素, 其中所述四元组中的客体要素 是未知的;
对所述时间戳进行编码, 获取 所述时间戳的时间向量表示;
使用经训练的预训练语言模型和经训练的图神经网络模型分别得到所述主体要素的
主体向量表示和所述类型要素的类型向量表示;
基于所述时间向量表示、 主体向量表示和类型向量表示, 得到对所述未来事件的客体
要素的预测结果,
存储器, 用于存 储所述一个或更多个神经网络的网络参数。
13.一种计算设备, 其特征在于, 所述计算设备包括存储器和 处理器, 所述存储器上存
储有计算机程序, 所述计算机程序在被所述处理器运行时, 使得所述处理器执行如权利要
求1‑11中任一项所述的方法。
14.一种计算机可读介质, 其特征在于, 所述计算机可读介质上存储有计算机程序, 所
述计算机程序在被运行时, 执 行如权利要求1 ‑11中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 114462673 A
3
专利 用于预测未来事件的方法、系统、计算设备和可读介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:30:17上传分享