安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210455802.6 (22)申请日 2022.04.24 (71)申请人 北京金山数字 娱乐科技有限公司 地址 100085 北京市海淀区西二 旗中路33 号院5号楼1 1层002号 (72)发明人 黄继豪 李长亮 (74)专利代理 机构 北京柏杉松知识产权代理事 务所(普通 合伙) 11413 专利代理师 孙翠贤 高莺然 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/58(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种文本风格迁移模型训练及文本风格迁 移方法及装置 (57)摘要 本发明实施例提供了一种文本风格迁移模 型训练及 文本风格迁移方法及装置, 涉及文本风 格迁移技术领域。 上述训练方法包括: 获取各个 第一语料对和各个第二语料对; 其中, 第一语料 对包括初始风格文本与第一文本, 第二语料对包 括目标风格文本与第二文本, 初始风格文本和目 标风格文本属于目标语言, 第一文本和第二文本 属于指定语言, 指定语言与目标语言不同; 利用 第一语料对和第二语料对, 建立各个目标风格文 本与属于初始风格的第三文本的对应 关系; 利用 对应关系, 对初始文本风格迁移模型进行训练, 得到训练完成的目标文本风格迁移模 型。 与现有 技术相比, 应用本发明实施例提供的方案, 可 以 提高所训练得到的文本风格迁移模型的文本迁 移结果的准确率。 权利要求书2页 说明书13页 附图3页 CN 114818728 A 2022.07.29 CN 114818728 A 1.一种文本风格迁移模型训练方法, 其特 征在于, 所述方法包括: 获取各个第 一语料对和各个第 二语料对; 其中, 每个第 一语料对包括: 初始风格文本与 对应的第一文本, 每个第二语料对包括: 目标风格文本与对应的第二文本, 各个初始风格文 本和各个目标风格文本属于目标语言, 各个第一文本和各个第二文本属于指定语言, 所述 指定语言与所述目标语言不同; 利用各个第 一语料对和各个第 二语料对, 建立各个目标风格文本与属于初始风格的第 三文本的对应关系; 利用所述对应关系, 对初始文本风格迁移模型进行训练, 得到训练完成的目标文本风 格迁移模型。 2.根据权利要求1所述的方法, 其特征在于, 所述利用各个第 一语料对和各个第 二语料 对, 建立各个目标风格文本与属于初始风格的第三文本的对应关系的步骤, 包括: 利用各个第一语料对训练用于将所述指定语言翻译至所述目标语音的目标翻译模型; 利用所述目标翻译模型对各个第 二语料对中的第 二文本进行翻译, 得到各个第 二文本 对应的属于初始风格的第三文本; 针对每个第 二预料对, 建立对应于该第 二语料对中的第 二文本的目标风格文本与第 三 文本的对应关系。 3.根据权利要求1所述的方法, 其特征在于, 所述利用所述对应关系, 对初始文本风格 迁移模型进行训练, 得到训练完成的目标文本风格迁移模型的步骤, 包括: 将每个第三文本作为输入, 并将每个第三文本对应的目标风格文本作为输出, 对初始 文本风格迁移模型进行训练, 得到训练完成的目标文本风格迁移模型。 4.根据权利要求1所述的方法, 其特征在于, 所述各个初始风格文本 中不包括所述各个 目标风格文本 。 5.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述初始文本风格迁移模型为: Transformer模型, 或者, 篇 章级Transformer模型。 6.一种文本风格迁移方法, 其特 征在于, 所述方法包括: 获取待迁移文本; 将所述待迁移文本输入预设的目标文本风格迁移模型中; 其中, 所述目标文本风格迁 移模型是基于权利要求1 ‑5任一项所述的方法训练得到的; 获取所述目标文本风格迁移模型的输出结果, 作为所述待迁移文本进行文本风格迁移 后的目标文本 。 7.一种文本风格迁移模型训练装置, 其特 征在于, 所述装置包括: 语料对获取模块, 用于获取各个第 一语料对和各个第 二语料对; 其中, 每个第 一语料对 包括: 初始 风格文本与对应的第一文本, 每个第二语料对包括: 目标风格文本与对应的第二 文本, 各个初始风格文本和各个目标风格文本属于目标语言, 各个第一文本和各个第二文 本属于指定语言, 所述指定语言与所述目标语言不同; 对应关系确定模块, 用于利用各个第一语料对和各个第二语料对, 建立各个目标风格 文本与属于初始风格的第三文本的对应关系; 模型训练模块, 用于利用所述对应关系, 对初始文本风格迁移模型进行训练, 得到训练 完成的目标文本风格迁移模型。权 利 要 求 书 1/2 页 2 CN 114818728 A 28.一种文本风格迁移装置, 其特 征在于, 所述装置包括: 文本获取模块, 用于获取待迁移文本; 文本输出模块, 用于将所述待迁移文本输入预设的目标文本风格迁移模型中; 其中, 所 述目标文本风格迁移模型 是基于权利要求1 ‑5任一项所述的方法训练得到的; 结果获取模块, 用于获取所述目标文本风格迁移模型的输出结果, 作为所述待迁移文 本进行文本风格迁移后的目标文本 。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1 ‑5任一所述的方法步骤, 和/或, 权利要求6所述的方法步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质内存储有计算机 程序, 所述计算机程序被处理器执行时实现权利要求1 ‑5任一所述的方法步骤和/或, 权利 要求6所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 114818728 A 3
专利 一种文本风格迁移模型训练及文本风格迁移方法及装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:46:39
上传分享
举报
下载
原文档
(607.5 KB)
分享
友情链接
T-GDPMAA 0005—2020 精准护理体系.pdf
GB-T 42012-2022 信息安全技术 即时通信服务数据安全要求.pdf
GB-Z 42885-2023 信息安全技术 网络安全信息共享指南.pdf
三级等保测评指导书(整合版).xlsx
法律法规 中华人民共和国技术进出口管理条例2020-11-29.pdf
数据出境安全评估办法(征求意见稿).pdf
T-CRHA 015—2023 成人经鼻高流量氧疗护理规范.pdf
GB/T 21709.3-2021 针灸技术操作规范 第3部分:耳针.pdf
T-GXAS 409—2022 建设项目社会稳定风险分析报告编制规范.pdf
GB-T 14619-2013 厚膜集成电路用氧化铝陶瓷基片.pdf
T-CVMA 47—2020 猫星状病毒RT-PCR检测方法.pdf
GB-Z 25425-2010 风力发电机组 公称视在声功率级和音值.pdf
GB-T 35073-2018 燃气燃烧器节能等级评价方法.pdf
XF-T 999-2012 防排烟系统性能现场验证方法热烟试验法.pdf
GB-T 30363-2013 森林植被状况监测技术规范.pdf
T-CRES 0008—2020 海上风力发电机组 验收规程.pdf
GB-T 37966-2019 纳米技术 氧化铁纳米颗粒类过氧化物酶活性测量方法.pdf
GB-Z 29830.1-2013 信息技术 安全技术 信息技术安全保障框架 第1部分:综述和框架.pdf
GB 42295-2022 电动自行车电气安全要求.pdf
T-NIFA 22—2023 金融数据安全应急响应和处置指引.pdf
1
/
3
19
评价文档
赞助2.5元 点击下载(607.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。