安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210370868.5 (22)申请日 2022.04.11 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 金晓辉 阮晓雯 陈远旭  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G16H 50/20(2018.01) G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/30(2020.01)G06N 3/04(2006.01) (54)发明名称 角色对话模拟方法、 装置、 设备及存 储介质 (57)摘要 本发明涉及自然语 言处理技术, 揭露了一种 角色对话模拟方法, 包括: 对对话语料进行角色 分类、 文本清洗, 得到不同角色对应的训练文本, 利用构建的预训练对话模型对训练文本进行位 置编码、 矩阵计算以及预测计算, 得到预测结果, 根据预测结果计算得到的相关度结果确定是否 停止训练, 若停 止训练, 则得到对话模型; 对用户 输入进行文本处理, 将处理后的文本输入对话模 型进行计算, 得到输出结果, 对输出结果进行重 复性筛选及采样, 得到目标输出结果, 根据输出 结果判断句子生成是否结束, 当句子生成结束 时, 对目标输 出结果进行拼接, 得到回复对话。 本 发明还提出一种角色对话模拟装置、 电子设备以 及存储介质。 本发明可以提高角色智能对话模拟 的灵活性。 权利要求书3页 说明书12页 附图4页 CN 114822812 A 2022.07.29 CN 114822812 A 1.一种角色对话模拟方法, 其特 征在于, 所述方法包括: 获取对话语料, 对所述对话语料进行角色分类、 文本清洗, 得到不同角色对应的训练文 本; 构建预训练对话模型, 并利用所述预训练对话模型对所述不同角色对应的训练文本进 行位置编码, 得到文本矩阵; 对所述文本矩阵进行矩阵计算及预测计算, 得到预测对话, 根据所述预测对话和所述 训练文本计算相关度结果, 并判断所述相关度结果是否大于预设阈值; 若所述相关度结果小于或等于所述阈值, 则更新所述文本矩阵, 并返回对所述文本矩 阵进行矩阵计算及预测计算的步骤; 若所述相关度结果大于所述阈值, 则停止训练, 得到对话模型; 根据预设条件确定所述对话模型的角色, 获取用户输入, 对所述用户输入进行文本处 理, 得到目标文本; 将所述目标文本输入所述对话模型中, 得到模型输出结果, 对所述模型输出结果进行 重复性筛 选及采样, 得到目标输出 结果, 并根据所述目标输出 结果判断句子生成是否结束; 若句子生成未 结束, 则返回将所述目标文本 输入所述对话模型中的步骤。 若句子生成结束, 则对所述目标输出 结果进行拼接, 得到回复对话。 2.如权利要求1所述的角色对话模拟方法, 其特征在于, 所述对所述对话语料进行角色 分类、 文本清洗, 得到不同角色对应的训练文本, 包括: 将所述对话语料输入预设的分类模型中, 得到对话语料对应的角色预测结果; 根据所述角色预测结果对所述对话语料进行分类, 得到每 个角色对应的语料; 剔除所述每 个角色对应的语料中的预设字符, 得到每 个角色对应的第一文本; 对所述第一文本进行语义识别, 计算语义识别结果与预设文本向量的距离值, 将距离 值小于预设阈值的语义识别结果所对应的文本删除, 得到每 个角色对应的第二文本; 分别将每 个角色对应的第二文本进行文本拼接, 得到每 个角色对应的训练文本 。 3.如权利要求2所述的角色对话模拟方法, 其特征在于, 所述分别将每个角色对应的第 二文本进行文本拼接, 得到每 个角色对应的训练文本, 包括: 从多个角色中选取一个角色作为目标角色, 将所述目标角色对应的第 二文本作为目标 文本; 根据所述目标文本计算得到平均句长, 并根据所述平均句长设置所述目标文本的长 度, 将设置好长度的目标文本进行 首尾拼接, 得到所述目标角色对应的训练文本 。 4.如权利要求1所述的角色对话模拟方法, 其特征在于, 所述构建预训练对话模型, 包 括: 将模型划分为四部分, 第 一部分为向量生成层, 第 二部分为第一向量处理层, 第 三部分 为第二向量处 理层, 第四部分为预测层; 在所述向量 生成层中添加位置编码结构及Embed ding结构; 在所述第一向量处理层中添加LayerNorm结构、 Masked  Multiself ‑Attention结构以 及残差连接结构; 在所述第二向量处 理层中添加LayerN orm结构、 F eed Forward结构以及残差连接结构; 在所述预测层中添加LayerN orm结构及预测函数。权 利 要 求 书 1/3 页 2 CN 114822812 A 25.如权利要求4所述的角色对话模拟方法, 其特征在于, 所述对所述文本矩阵进行矩阵 计算及预测计算, 得到预测对话, 包括: 利用所述第向量处理层对所述文本矩阵进行归一化、 注意力计算以及残差计算, 得到 第一向量矩阵; 利用所述第二向量处理层所述文本矩阵进行归一化、 前馈神经调节以及残差计算, 得 到第二向量矩阵; 利用所述预测层对所述第二向量矩阵进行归一化, 并将归一化的结果输入预测函数 中, 得到预测结果, 所述预测结果包括预测文字和结束符; 判断所述预测结果是 预测文字还是 结束符; 若所述预测结果是预测文字, 则返回利用所述第向量处理层对所述文本矩阵进行归一 化、 注意力计算以及残差计算, 得到第一向量矩阵的步骤; 若所述预测结果是 结束符, 则将所有的预测结果进行拼接, 得到预测对话。 6.如权利要求1所述的角色对话模拟方法, 其特征在于, 所述根据 所述预测对话和所述 训练文本计算相关度结果, 包括: 获取该预测对话所对应的角色之外其他角色的训练文本, 将所述其他角色的训练文本 作为对比文本; 根据所述对比文本生成对比矩阵, 对所述对比矩阵进行线性化处理, 得到第一线性向 量; 对所述第一线性向量进行特征压缩, 得到第二线性向量, 在所述第二线性向量中提取 与所述预测对话对应的字 向量的相关度, 将所述相关度结果输入预设的概率输出函数中, 得到相关度结果。 7.如权利要求1至6中任一项所述的角色对话模拟方法, 其特征在于, 所述对所述模型 输出结果进行重复性筛 选及采样, 得到目标输出 结果, 包括: 获取上一个结束符 之后所述对话模型的所有输出 结果; 将所述模型输出 结果与所述所有输出 结果进行重复性检测; 若出现重复的输出结果, 则根据预设的重复性惩罚在所述对话模型中去除所述重复的 输出结果, 并利用所述对话模型重新生成模型输出结果, 并返回将所述模型输出结果与所 述所有输出 结果进行重复性检测的步骤; 若未出现重复的输出结果, 则在所述模型输出结果中进行随机采样, 将采样结果作为 目标输出 结果。 8.一种角色对话模拟装置, 其特 征在于, 所述装置包括: 文本生成模块, 用于获取对话语料, 对所述对话语料进行角色分类、 文本清洗, 得到不 同角色对应的训练文本, 以及根据预设条件确定所述对话模型的角色, 获取用户输入, 对所 述用户输入进行文本处 理, 得到目标文本; 文本矩阵生成模块, 用于构建预训练对话模型, 并利用所述预训练对话模型对所述不 同角色对应的训练文本进行位置编码, 得到文本矩阵; 模型训练模块, 用于对所述文本矩阵进行矩阵计算及预测计算, 得到预测对话, 根据 所 述预测对话和所述训练文本计算相关度结果, 并判断所述相关度结果是否大于预设阈值; 若所述相关度结果小于或等于所述阈值, 则更新所述文本矩阵, 并返回对所述文本矩阵进权 利 要 求 书 2/3 页 3 CN 114822812 A 3

.PDF文档 专利 角色对话模拟方法、装置、设备及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 角色对话模拟方法、装置、设备及存储介质 第 1 页 专利 角色对话模拟方法、装置、设备及存储介质 第 2 页 专利 角色对话模拟方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:52:17上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。