安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210431596.5 (22)申请日 2022.04.22 (71)申请人 合众新能源 汽车有限公司 地址 314500 浙江省嘉兴 市桐乡市梧桐街 道同仁路98 8号 (72)发明人 马伯睿 朱亚杰 王章定 魏德山  王波  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 骆希聪 (51)Int.Cl. G06F 40/211(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 用于对话系统的指代消解方法、 装置及存储 介质 (57)摘要 本发明涉及一种用于对话系统的指代消解 方法, 方法包括: 将对话系统接收到的句子进行 编码, 得到句子的句矩阵; 将句矩阵输入第一分 类器组, 获得句子的先行语的头索引和尾索引; 根据先行语的头索引和尾索引获得先行语向量; 将先行语向量与句矩阵作点积得到相关向量; 将 相关向量输入第二分类器组, 获得句子的一个或 多个照应语的头索引和尾索引; 根据先行语的头 索引和尾索引从句子中取出先行语, 根据一个或 多个照应语的头索引和尾索引从句子中取出一 个或多个照应语, 得到指代消解结果。 本发明可 以识别句子中同一个先行语所对应的多个照应 语, 为后续的对话内容处理提供更加完整的信 息。 权利要求书2页 说明书8页 附图3页 CN 114818657 A 2022.07.29 CN 114818657 A 1.一种用于对话系统的指代消解方法, 其特 征在于, 包括: 将对话系统接收到的句子进行编码, 得到所述句子的句矩阵; 将所述句矩阵输入第一分类 器组, 获得 所述句子的先 行语的头索引和尾索引; 根据所述先 行语的头索引和尾索引获得 先行语向量; 将所述先 行语向量与所述句矩阵作点积得到相关向量; 将所述相关 向量输入第 二分类器组, 获得所述句子的一个或多个照应语的头索引和尾 索引; 根据所述先行语的头索引和尾索引从所述句子 中取出先行语, 根据所述一个或多个照 应语的头索引和尾索引从所述句子中取 出一个或多个照应 语, 得到指代消解结果。 2.如权利要求1所述的指代消解方法, 其特征在于, 所述第 一分类器组和所述第 二分类 器组中的分类 器为二元分类 器。 3.如权利要求2所述的指代消解方法, 其特征在于, 所述第 一分类器组内的分类器表示 为: 其中 是句矩阵中第i个位置是先行语的索引的概率, hi是句矩阵中的第i个位置的 向量, Want是第一权重矩阵, bant是第一偏置, σ是激活函数, softmax是归一化指数函数, softmax函数将 的最大值 设为1, 其余值为0, 是指示第i个位置是否为先行语的索引 的结果。 4.如权利要求3所述的指代消解方法, 其特 征在于, 所述第一分类 器组包括 第一分类 器, 用于识别所述句子中的先 行语的头索引; 第二分类 器, 用于识别所述句子中的先 行语的尾索引。 5.如权利要求1所述的指代消解方法, 其特征在于, 根据 所述先行语的头索引和尾索引 获得先行语向量的步骤 包括: 取出所述句矩阵中所述先 行语的头索引和尾索引之间的所有向量; 将取出的所述所有向量 求和得到先 行语向量。 6.如权利要求2所述的指代消解方法, 其特征在于, 所述第 二分类器组内的分类器表示 为: 采用如下公式计算句矩阵中其第i个位置是照应 语的索引的概 率, 其中 是句矩阵中其第i个位置是照应语的索引的概率, h ′i是相关向量的第i个位置 的向量, Wana是第二权 重矩阵, bana是第二偏置, σ 是激活函数; 设定第一阈值, 将所述照应语的索引的概率 大于第一阈值的分类结果设为1, 否则, 设为0。 7.如权利要求6所述的指代消解方法, 其特 征在于, 所述第二分类 器组包括: 第三分类 器, 用于识别所述句子中的照应 语的头索引; 第四分类 器, 用于识别所述句子中的照应 语的尾索引。权 利 要 求 书 1/2 页 2 CN 114818657 A 28.如权利要求1所述的指代消解方法, 其特征在于, 在根据 所述一个或多个照应语的头 索引和尾索引从所述句子中取 出一个或多个照应 语之前, 还 包括步骤: 将所述一个或多个照应语的头索引和尾索引进行一一配对, 未出现头索引的尾索引或 未出现尾索引的头索引不进行配对, 最终得到一个或多个照应 语的索引对。 9.如权利要求1所述的指代消解方法, 其特征在于, 通过预训练编码器对所述句子进行 编码。 10.如权利要求9所述的指代消解方法, 其特征在于, 所述预训练编码器为具有构建上 下文依赖能力的编码器。 11.如权利要求9所述的指代消解方法, 其特征在于, 所述句矩阵的大小为M*N, 其中M为 编码后每 个字向量或词向量的维度, N 为句子长度。 12.如权利要求1所述的指代消解方法, 其特 征在于, 还 包括: 对接收到的句子进行 预处理, 所述预处 理包括分词、 词性和去除停用词。 13.一种用于对话系统的指代消解装置, 包括: 存储器, 用于存 储可由处 理器执行的指令; 处理器, 用于执 行所述指令以实现如权利要求1 ‑12任一项所述的方法。 14.一种存储有计算机程序代码 的计算机可读介质, 所述计算机程序代码在由处理器 执行时实现如权利要求1 ‑12任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114818657 A 3

.PDF文档 专利 用于对话系统的指代消解方法、装置及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于对话系统的指代消解方法、装置及存储介质 第 1 页 专利 用于对话系统的指代消解方法、装置及存储介质 第 2 页 专利 用于对话系统的指代消解方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。