安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210455802.6 (22)申请日 2022.04.24 (71)申请人 北京金山数字 娱乐科技有限公司 地址 100085 北京市海淀区西二 旗中路33 号院5号楼1 1层002号 (72)发明人 黄继豪 李长亮  (74)专利代理 机构 北京柏杉松知识产权代理事 务所(普通 合伙) 11413 专利代理师 孙翠贤 高莺然 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/58(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种文本风格迁移模型训练及文本风格迁 移方法及装置 (57)摘要 本发明实施例提供了一种文本风格迁移模 型训练及 文本风格迁移方法及装置, 涉及文本风 格迁移技术领域。 上述训练方法包括: 获取各个 第一语料对和各个第二语料对; 其中, 第一语料 对包括初始风格文本与第一文本, 第二语料对包 括目标风格文本与第二文本, 初始风格文本和目 标风格文本属于目标语言, 第一文本和第二文本 属于指定语言, 指定语言与目标语言不同; 利用 第一语料对和第二语料对, 建立各个目标风格文 本与属于初始风格的第三文本的对应 关系; 利用 对应关系, 对初始文本风格迁移模型进行训练, 得到训练完成的目标文本风格迁移模 型。 与现有 技术相比, 应用本发明实施例提供的方案, 可 以 提高所训练得到的文本风格迁移模型的文本迁 移结果的准确率。 权利要求书2页 说明书13页 附图3页 CN 114818728 A 2022.07.29 CN 114818728 A 1.一种文本风格迁移模型训练方法, 其特 征在于, 所述方法包括: 获取各个第 一语料对和各个第 二语料对; 其中, 每个第 一语料对包括: 初始风格文本与 对应的第一文本, 每个第二语料对包括: 目标风格文本与对应的第二文本, 各个初始风格文 本和各个目标风格文本属于目标语言, 各个第一文本和各个第二文本属于指定语言, 所述 指定语言与所述目标语言不同; 利用各个第 一语料对和各个第 二语料对, 建立各个目标风格文本与属于初始风格的第 三文本的对应关系; 利用所述对应关系, 对初始文本风格迁移模型进行训练, 得到训练完成的目标文本风 格迁移模型。 2.根据权利要求1所述的方法, 其特征在于, 所述利用各个第 一语料对和各个第 二语料 对, 建立各个目标风格文本与属于初始风格的第三文本的对应关系的步骤, 包括: 利用各个第一语料对训练用于将所述指定语言翻译至所述目标语音的目标翻译模型; 利用所述目标翻译模型对各个第 二语料对中的第 二文本进行翻译, 得到各个第 二文本 对应的属于初始风格的第三文本; 针对每个第 二预料对, 建立对应于该第 二语料对中的第 二文本的目标风格文本与第 三 文本的对应关系。 3.根据权利要求1所述的方法, 其特征在于, 所述利用所述对应关系, 对初始文本风格 迁移模型进行训练, 得到训练完成的目标文本风格迁移模型的步骤, 包括: 将每个第三文本作为输入, 并将每个第三文本对应的目标风格文本作为输出, 对初始 文本风格迁移模型进行训练, 得到训练完成的目标文本风格迁移模型。 4.根据权利要求1所述的方法, 其特征在于, 所述各个初始风格文本 中不包括所述各个 目标风格文本 。 5.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述初始文本风格迁移模型为: Transformer模型, 或者, 篇 章级Transformer模型。 6.一种文本风格迁移方法, 其特 征在于, 所述方法包括: 获取待迁移文本; 将所述待迁移文本输入预设的目标文本风格迁移模型中; 其中, 所述目标文本风格迁 移模型是基于权利要求1 ‑5任一项所述的方法训练得到的; 获取所述目标文本风格迁移模型的输出结果, 作为所述待迁移文本进行文本风格迁移 后的目标文本 。 7.一种文本风格迁移模型训练装置, 其特 征在于, 所述装置包括: 语料对获取模块, 用于获取各个第 一语料对和各个第 二语料对; 其中, 每个第 一语料对 包括: 初始 风格文本与对应的第一文本, 每个第二语料对包括: 目标风格文本与对应的第二 文本, 各个初始风格文本和各个目标风格文本属于目标语言, 各个第一文本和各个第二文 本属于指定语言, 所述指定语言与所述目标语言不同; 对应关系确定模块, 用于利用各个第一语料对和各个第二语料对, 建立各个目标风格 文本与属于初始风格的第三文本的对应关系; 模型训练模块, 用于利用所述对应关系, 对初始文本风格迁移模型进行训练, 得到训练 完成的目标文本风格迁移模型。权 利 要 求 书 1/2 页 2 CN 114818728 A 28.一种文本风格迁移装置, 其特 征在于, 所述装置包括: 文本获取模块, 用于获取待迁移文本; 文本输出模块, 用于将所述待迁移文本输入预设的目标文本风格迁移模型中; 其中, 所 述目标文本风格迁移模型 是基于权利要求1 ‑5任一项所述的方法训练得到的; 结果获取模块, 用于获取所述目标文本风格迁移模型的输出结果, 作为所述待迁移文 本进行文本风格迁移后的目标文本 。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1 ‑5任一所述的方法步骤, 和/或, 权利要求6所述的方法步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质内存储有计算机 程序, 所述计算机程序被处理器执行时实现权利要求1 ‑5任一所述的方法步骤和/或, 权利 要求6所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 114818728 A 3

.PDF文档 专利 一种文本风格迁移模型训练及文本风格迁移方法及装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文本风格迁移模型训练及文本风格迁移方法及装置 第 1 页 专利 一种文本风格迁移模型训练及文本风格迁移方法及装置 第 2 页 专利 一种文本风格迁移模型训练及文本风格迁移方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:46:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。